نموذج الذكاء الاصطناعي من قبل جوجل يُسمى AudioPaLM والذي يركز على مجالات الكلام والترجمة.

 تم الكشف عن نموذج الذكاء الاصطناعي اللغوي الجديد AudioPaLM من قبل شركة جوجل. يتميز هذا النموذج الجديد بقدرته على الاستماع والتحدث والترجمة بدقة عالية وسرعة كبيرة.

يتم الاعتماد في الأساس على نقاط القوة لنموذجين آخرين موجودين بالفعل وهما PaLM-2 و AudioLM، وهذا ما يعكسه اسم النموذج AudioPaLM.

نموذج الذكاء الاصطناعي من قبل جوجل يُسمى AudioPaLM والذي يركز على مجالات الكلام والترجمة.

ينتمي نموذج PaLM-2 إلى فئة نماذج اللغة الكبيرة LLMs، وهذه النماذج قادرة على فهم ومحاكاة وتوليد النصوص بطريقة تشبه اللغات البشرية. بالمقابل، يركز نموذج AudioLM على جوانب مثل الحفاظ على هوية المتحدث ونبرة الصوت (الصوتيات).


تمكن الباحثون في جوجل من تطوير نموذج AudioPaLM الجديد عن طريق دمج كلا النموذجين السابقين المشار إليهما، لتحقيق توليد النصوص والكلام بكفاءة عالية.


يتمتع النموذج الجديد AudioPaLM بقدرة فائقة على أداء مجموعة متنوعة من المهام، بما في ذلك الترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نبرة الصوت الأصلية. بالإضافة إلى ذلك، يمكن للنموذج التقاط الأصوات والأوامر المنطوقة، ثم إعادة إنتاجها بلغات مختلفة أخرى.


يعمل النموذج على تعرف الأصوات وترجمتها إلى نصوص، وقد أظهرت الدراسات التي أجريت على النموذج قدرته على ترجمة التراكيب اللغوية التي لم يتعرض لها من قبل بدقة عالية، وفقًا للباحثين المعنيين.


تواصل شركة جوجل العمل على تطوير النموذج، وحتى الآن لم يتم الإعلان عن موعد توافره للجمهور.

على جانب آخر، أعلنت شركة ميتا (السابقة فيسبوك) سابقًا عن نموذج ذكاء اصطناعي يحمل اسم Voicebox، وهو نموذج حديث يتمتع بالقدرة على إنشاء الكلام، بما في ذلك تحرير المقاطع الصوتية بكفاءة وتوليد عينات صوتية بلغات مختلفة ومهام أخرى.



شارك الموضوع
تعليقات