علوم وتكنولوجيا

للكلام والترجمة.. جوجل تعلن عن نموذج الذكاء الاصطناعى الجديد AudioPaLM

أعلنت شركة جوجل عن إطلاق نموذج جديد للذكاء الاصطناعي اللغوي باسم AudioPaLM، الذي يتميز بالقدرة على الاستماع والتحدث والترجمة بدقة عالية وسرعة كبيرة للكلام والترجمة.

للكلام والترجمة

يعتمد هذا النموذج الجديد على نقاط القوة في نموذجين آخرين موجودين بالفعل وهما PaLM-2 و AudioLM، ويتميز بقدرته على توليد النصوص والكلام بكفاءة عالية.

 

ينتمي نموذج PaLM-2 إلى نماذج اللغة الكبيرة LLMs التي تستطيع فهم ومحاكاة وتوليد النصوص بشكل يشبه اللغات البشرية، بينما يعني نموذج AudioLM بأشياء مثل الحفاظ على هوية المتحدث ونبرة الصوت.

نموذج AudioPaLM

ويقوم نموذج AudioPaLM بدمج النموذجين السابقين معًا لتحسين قدراته على إنتاج النصوص والكلام بكفاءة عالية.

يستطيع نموذج AudioPaLM الجديد القيام بالعديد من الوظائف المختلفة مثل الترجمة الصوتية من لغة إلى أخرى، والتقاط الأصوات أو الأوامر المنطوقة، ثم إعادة إنتاج الصوت بلغات أخرى مختلفة.

كما يعمل النموذج على تعرّف الأصوات وترجمتها إلى نصوص، حتى التراكيب اللغوية التي لم يتعرض لها من قبل.

وترجع الاشارة إلى أن نموذج جوجل لا يزال قيد البحث والتطوير، ولم يتم الإعلان عن موعد توفره للجمهور.

وفي وقت سابق، أعلنت شركة ميتا عن نموذج ذكاء اصطناعي جديد باسم Voicebox، الذي يتميز بقدرات إنشاء الكلام وتحرير المقاطع الصوتية بكفاءة.

وكانت  شركة Google العملاقة عن استثمار بقيمة 10 مليارات دولار في صندوق الرقمنة الهندي، كما تخطط لافتتاح مركز عمليات التكنولوجيا المالية العالمية في GIFT City في ولاية غوجارات الهندية.

تم التأكيد على هذه الخطط خلال لقاء جمع بين ساندر بيتشاي، الرئيس التنفيذي لشركة Google، ورئيس الوزراء الهندي ناريندرا مودي خلال زيارته الأخيرة للولايات المتحدة الأمريكية.

تحسين خدمات الإنترنت

وأشاد بيتشاي برؤية مودي لـ “الهند الرقمية”، والتي تهدف إلى تحسين خدمات الحكومة الهندية للمواطنين عبر الإنترنت، وأعرب عن اعتقاده بأن هذه الرؤية قد تكون مثالًا يحتذى به في العالم

مقالات ذات صلة

زر الذهاب إلى الأعلى