في مؤتمر مطوري غوغل في مايو 2023 كشف ساندر بيتشاي الرئيس التنفيذي لشركة غوغل عن أداة الذكاء الاصطناعي جيميني. أوضح بيتشاي وقتها أن فريقي غوغل براين (Brain Team) ، وديب مايند (DeepMind) ، يعملان على تطوير نموذج اللغة الكبير (LLM)، الذي يمكنه منافسة «تشات جي بي تي» من شركة «أوبن إيه آي» وربما يتفوق عليه.
وذكر بيتشاي أن جيميني مصمم من الألف إلى الياء ليكون متعدد الوسائط، أي أنه يستطيع فهم ومعالجة النصوص والصور، وهو ما يسمح بقدرات محادثة أكثر طبيعية.
أشعلت غوغل سباق الذكاء الاصطناعي بإطلاق الأداة الجديدة جيميني
بعد 7 شهور من المؤتمر أطلقت شركة غوغل نموذجها الأكثر تقدماً للذكاء الاصطناعي، باسم «جيميني»، المُصمم خصيصاً لمنافسة نظيره «شات جي بي تي» المطور من قبل شركة «أوبن إيه آي».
ووصفت غوغل «جيميني» بأنه «النموذج الأكبر والأكثر قدرة في الذكاء الاصطناعي»، الذي يلبي احتياجات كافة المستخدمين في كل بيئة، من أجهزة الشركات الكبيرة إلى مستخدمي الهواتف.
ويعد نموذج «جيميني» وليد عملية دمج مختبرات البحوث الأساسية في غوغل «Deepmind» و«Brain».
ويأتي الإصدار الأول من نموذج «جيميني» بـ 3 أحجام وقدرات، وهي «جيميني نانو» لمعالجة البيانات على الهواتف الذكية العاملة بنظام أندرويد، والثاني «جيميني برو» لمجموعة واسعة من المهام، أما «جيميني ألترا» فهو أول نموذج للذكاء الاصطناعي يتفوق على الخبراء البشريين في المعرفة ولديه قدرات حل المشكلات عبر 57 موضوعاً، من بينها الرياضيات، والطب، والتاريخ، والأخلاق، بالإضافة إلى فهم وإنشاء الأكواد والرموز في لغات البرمجة، حسبما وصفته غوغل.
وسيعتمد نموذج الذكاء الاصطناعي للمحادثة باللغة الطبيعية «غوغل بارد» على نموذج اللغة «جيميني برو»، ما يتيح تزويد مستخدمي الإنترنت الناطقين باللغة الإنجليزية بإجابات أكثر ثراءً ودقة في أكثر من 170 دولة وإقليماً، وتخطط غوغل للتوسع ودعم لغات أخرى ومواقع جديدة، بدءاً من مطلع عام 2024.
وبحسب «غوغل»، فإن إصدار «ألترا» من «جيميناي» تفوق على نماذج الذكاء الاصطناعي «المتطورة»، بما في ذلك أقوى نموذج لتطبيق «تشات جي بي تي» (تشات جي بي تي-4) في 30 من أصل 32 اختبارا قياسيا، بما في ذلك الاستدلال وفهم الصورة.
كما تفوق نموذج «برو» من «جيميناي» في 6 من أصل 8 اختبارات على «تشات جي بي تي-3.5»، وهو الإصدار المجاني من التطبيق الشهير الذي طورته شركة «أوبن إيه آي».
الكثير من الخصائص والمميزات التي تطغى على نموذج Gemini يمكن الاعتماد عليها واستغلالها في الحياة العملية وتطبيقها في مختلف المجالات، لذلك إليك أبرزها:
القدرة الاستيعابية الأكثر لقواعد البيانات الضخمة، بحيث تصل إلى 175 بليون قيمة. إظهار ردود فعل واستجابة أفضل مع الاستفسارات المطروحة عليه. القدرة على التعامل مع الوسائط المتعددة من نصوص وفيديوهات وصور. قابلية التعامل مع مختلف منتجات جوجل بما فيها الباحث العلمي، كتب جوجل، يوتيوب وغيرها.
هل ترغب بالتعليق على الموضوع؟
لا تتردد في إعطاء تعليقك ومشاركة رأيك