11 ديسمبر 2024
Gemini يتيح تجربة "الحوسبة باللغة الطبيعية" في tldraw
إتاحة التفاعلات باللغة الطبيعية باستخدام Gemini API
تتيح Gemini API للمطوّرين دمج إمكانات الذكاء الاصطناعي المتقدّمة بسلاسة في تطبيقاتهم، ما يفتح آفاقًا جديدة لتجربة المستخدم والوظائف. توضّح هذه المشاركة كيف تستفيد tldraw من Gemini لإنشاء تجربة ثورية في "الحوسبة باللغة الطبيعية" ضمن مشروعها الجديد computer. يوضّح هذا المثال السرعة والسهولة التي يمكن للشركات الناشئة من خلالها دمج الذكاء الاصطناعي الفعّال باستخدام Gemini API وحزمة تطوير البرامج (SDK) الخاصة بلوحة العرض من tldraw. سيطلق فريق tldraw قريبًا تطبيق computer المزوّد بنموذج Gemini 1.5 Flash (يمكنك الانضمام إلى قائمة الانتظار)، ويعمل حاليًا على إنشاء نموذج أولي باستخدام Gemini 2.0 Flash لإطلاقه في الإصدارات المستقبلية.
تستخدم منصة tldraw واجهة Gemini API للاستفادة من إمكانات الذكاء الاصطناعي الحواري في البرمجة المرئية، ما يتيح للمستخدمين إنشاء المحتوى ومعالجة المعلومات باستخدام اللغة الطبيعية. يفتح هذا التحديث فرصًا مثيرة لتقديم تجربة مستخدم أكثر سهولة وفعالية في ما يتعلّق بالذكاء الاصطناعي، ما يؤدي إلى توسيع حدود التواصل المرئي.
الرؤية من وراء الكمبيوتر
سعت tldraw إلى تسهيل عملية إنشاء المخططات وجعلها أكثر سلاسة، وتصوّرت طريقة أكثر طبيعية ليتفاعل المستخدمون من خلالها مع لوحة العرض. سعى المؤسس "ستيف رويز" إلى الاستفادة من إمكانات حزمة تطوير البرامج (SDK) الخاصة بلوحة tldraw اللانهائية لإنشاء بيئة ديناميكية للعمل باستخدام الذكاء الاصطناعي التوليدي. أدت هذه الرؤية إلى تطوير computer، وهو تطبيق تجريبي يتيح للمستخدمين إنشاء سير عمل من مربعات النصوص والصور والتعليمات. عند تشغيلها، تنتقل المعلومات من مكوّن إلى آخر، وتكون نتيجة كل عملية إنشاء هي المدخل للعملية التالية، ما يؤدي إلى إنشاء عمليات فعّالة تتفرّع وتتكرّر وتتكرّر لإنتاج النتائج.
الاستفادة من Gemini 2.0: نظرة تفصيلية على علوم الكمبيوتر
تم إنشاء كمبيوتر tldraw استنادًا إلى شبكة من "المكوّنات" المترابطة التي تمثّل العناصر على لوحة العرض (مربّعات النصوص والصور ومقاطع الصوت وما إلى ذلك). يتم ربط هذه المكوّنات بواسطة أسهم، ما يوضّح تدفّق البيانات وعمليات التحويل. يتضمّن كل مكوّن "إجراءات" مرتبطة به، وهي مجموعات من التعليمات يتم تنفيذها استنادًا إلى المدخلات من المكوّنات المتصلة. يمكن لأحد المكوّنات قبول البيانات من أي عدد من المكوّنات الأخرى وتمرير بيانات الإخراج إلى العديد من المكوّنات الأخرى، بما في ذلك المكوّن نفسه. تتيح هذه البنية المستندة إلى المكوّنات، بالإضافة إلى قوة وسرعة نموذج Gemini 2.0 Flash، نظامًا سريعًا ومرنًا قادرًا على التعامل مع مهام متنوعة.
في ما يلي كيف ساهمت النماذج الأولية من Gemini 2.0 Flash في تحسين التجربة:
تنفيذ الإجراءات بسرعة فائقة: ينفّذ Gemini 2.0 Flash الإجراءات بسرعة. على سبيل المثال، قد يحتوي مكوّن "التعليمات" على "كتابة إعلان تجاري قصير". في غضون لحظات من تشغيل المكوّن، سيتم إنشاء نص برمجي قابل لإعادة الاستخدام يتضمّن خطوات يمكنها تحويل أي مجموعة من المدخلات إلى نص برمجي تجاري. سيستخدم المكوّن بعد ذلك هذا النص البرمجي، بالإضافة إلى مدخلاته الحالية (مثل مكوّن "نص" مع "قفازات ذكية جديدة تعمل بالذكاء الاصطناعي للقطط")، لإنشاء طلب ثانٍ إلى النموذج للحصول على الناتج النهائي. يمكن تمرير هذا الناتج إلى مكوّن "نص" آخر مرتبط لعرضه، بالإضافة إلى مكوّنات أخرى مرتبطة، مثل "كلام" لتحويل النص إلى كلام، أو "صورة" لإنشاء صور، أو مكوّنات "تعليمات" أخرى لإجراء المزيد من عمليات التحويل.
الكثير من السياق، والعديد من الأوضاع: يتطلّب النهج الأقصى في حاسوب tldraw السرعة والسعة والقدرة. بما أنّ ميزة "التفكير السريع" في Gemini 2.0 تستخدم عدة مكوّنات لتوفير البيانات لكل عملية إنشاء، كانت قدرة الاستيعاب الكبيرة ضرورية لإنتاج نتائج تأخذ جميع المدخلات في الاعتبار، كما أنّ إمكانية استخدام الصور والملفات إلى جانب الطلبات المكتوبة كانت ضرورية أيضًا.
البيانات المنظَّمة: لا يمكن أن يتم تبادل البيانات بين المكوّنات بدون الالتزام بمخطط واحد. يضمن الناتج المنظَّم بتنسيق JSON من Gemini 2.0 Flash أن يتمكّن كل مكوّن في سير العمل من التعرّف على البيانات من أي نوع وإنتاج مخرجاته في البنية نفسها، ما يمنع حدوث أي توقّف مؤقت ويؤدي إلى تنفيذ سلس ويضمن إكمال حتى أكبر سير العمل بشكل موثوق.
إنشاء إجراءات ديناميكية: بالإضافة إلى تنفيذ الإجراءات المحدّدة مسبقًا، يمكن لنموذج 2.0 Flash في Gemini إنشاء إجراءات ديناميكية. يمكن للمستخدم إدخال طلب مثل "إنشاء حملة تسويقية استنادًا إلى وصف المنتج هذا"، وسينشئ Gemini 2.0 Flash الخطوات اللازمة (الإجراءات) والمكوّنات المطلوبة، وينشئ سير عمل على لوحة العرض استنادًا إلى طلب المستخدم العام. تتيح هذه الميزة إمكانات هائلة لتقديم تجارب مبتكرة للمستخدمين وتبسيط سير العمل.
إنجاز سريع في مجال الابتكار
إنّ التنفيذ السريع الذي أجرته tldraw يسلّط الضوء على القيمة التي يقدّمها Gemini للشركات الناشئة، وهي: إنشاء نماذج أولية بسرعة، وتحسين تجربة المستخدم من خلال واجهات سهلة الاستخدام باللغة الطبيعية، والتعامل بكفاءة مع البيانات المنظَّمة بفضل نماذج مثل Gemini 2.0 Flash. تتيح هذه المجموعة للفرق الصغيرة إنشاء ميزات مبتكرة مستندة إلى الذكاء الاصطناعي بسرعة وبتكلفة مناسبة.
"نريد أن نوضّح أنّ بإمكان أي فريق إنشاء مشاريع طموحة باستخدام حزمة تطوير البرامج (SDK) الخاصة بلوحة tldraw. كان Gemini Flash محركًا مثاليًا لأداة سير عمل سريعة ومتعدّدة الوسائط تستند إلى لوحة العرض. مع Gemini 2.0 وربما اسم أفضل، أنا متأكد من أنّه يمكننا تقديم الكمبيوتر كشركة ناشئة مستقلة غدًا".
تعزيز تطبيقك باستخدام Gemini API
هل استلهمت فكرة تطبيقك من نجاح tldraw؟ توفّر Gemini API نماذج قوية، مثل Gemini 1.5 Pro وGemini 1.5 Flash، والآن Gemini 2.0 Flash كنموذج تجريبي مسبق، وذلك لتقديم ميزات مبتكرة تعمل بالذكاء الاصطناعي إلى تطبيقك. استكشِف مستندات Gemini API وقدِّم للمستخدمين تجربة محسّنة باستخدام الذكاء الاصطناعي.
بالنسبة إلى المحترفين المبدعين والمطوّرين والفرق من جميع الأنواع، يوفّر tldraw منصة فريدة وفعّالة لتحويل الأفكار إلى واقع ملموس. الانضمام إلى قائمة انتظار استخدام ميزة "الاستماع الذكي" على الكمبيوتر جرِّب مستقبل التعاون المرئي اليوم.