この度、Google が開発するオープンモデル「Gemma」に焦点を当てた Gemma Meetup を開催いたします。本 Meetup は、参加者の皆様が Gemma の可能性や活用事例について知識を共有し、議論を深めることを目的としています。Gemma の技術的な詳細、活用方法、事例、今後の展望など、幅広いテーマを取り上げ、Gemma コミュニティの活性化を目指します。
今回の Gemma Meetup には、特別ゲストとして、Gemma の開発に携わる Google DeepMind のエンジニア、Cassidy Hardin が来日し、Gemma 3 を含む Gemma の最新情報や今後の展望について話す予定です。
Gemma の最前線を直接学べる貴重な機会を、ぜひお見逃しなく!
申し込みはこちら
開催日 : 2025 年 4 月 24 日(木) 18:30 - 20:50(予定)
開催方法 : オンサイト(Google 渋谷オフィス)
会場定員 : 100 名
#gc_gemma
Gemma 3 最新情報Google DeepMind Cassidy Hardin
Gemma 3 は、シングル GPU または TPU で動作する、最も高性能なオープンモデルです。本セッションでは、Gemma 3 の最新情報、アーキテクチャ、活用事例などを解説します。
Gemma 3 の活用方法Google Cloud 片岡 義雅
Gemma は軽量なモデルであるため、さまざまなインフラストラクチャ上でのホスティングが可能です。本セッションでは Gemma のホスティングに利用可能な Google Cloud のサービスについてご紹介します。
neoAI Chat for オンプレミス:Gemma 3 を用いたオンプレミス RAG の実現株式会社neoAI AIソリューション事業部 / neoAI Research COO 寺澤 滉士良 氏
ネットやクラウドにアップロードできない機微秘匿データを対象とした生成 AI 活用は導入の難しさと AI の精度の二つの原因で進んでいません。neoAI はこの課題をうけ、neoAI Chat for オンプレミスを発表しました。今回の Gemma 3 は Gemma 2 にあった 2 つの大きな課題、画像入力ができない点とコンテキストの短さが克服された上、neoAI 独自の RAG ベンチマークでも高い点数をマークしています。
Google Cloud は、3 月 13 日 (木) に「 AI Agent Summit ’25 Spring」を 開催します。
2025 年は「AI エージェント元年」。生成 AI の活用が大きくシフトする年になると予測されます。その活用は、従来のチャットボットから、より高度な「AI エージェント」へと進化しつつあります。
本イベントでは、AI エージェントを活用して生産性を向上する方法や、独自の AI エージェントを構築するためのヒント、そして Google Cloud の最新の生成 AI 製品のアップデート、多くのお客様のユースケースをお届けします。
今回は現地会場参加者に抽選でオリジナル T シャツをプレゼントいたします。(※ T シャツのプレゼントには諸条件がございます。詳細は Web サイトをご覧ください)
ぜひ、 AI Agent Summit ’25 Spring にご参加ください。
日時 : 3 月 13 日(木)10:30 - 18:30(予定)
開催方法 : ハイブリッド(ベルサール渋谷ガーデン / オンライン配信)
参加費 : 無料(事前登録制)
会場定員 : 1,000 名
※来場希望者多数の場合は抽選制となります。
※ プログラムは変更になる可能性がございます。最新の情報は上記 Web ページにてご確認ください。
Google Cloud の生成 AI 「Gemini」を始め、最新の 生成 AI の動向や企業活動へどのように取り入れていくかを事例を踏まえてご紹介します。
基調講演のゲストとして、各業界を代表する 3 社、日本電気、博報堂DYメディアパートナーズ、アダストリアの皆様にご登壇いただきます。
最新の生成 AI 製品やソリューション、パートナー、お客様の事例やデモを、体験できるエリアです。各階にブースをご用意していますのでぜひお立ち寄りください。
第 3 回 生成 AI Innovation Awards のファイナリストによるピッチコンテストを同イベントで開催。
企業の課題を解決するために、生成 AI 技術を活用したアイデアやソリューションを促進し、革新的かつ実用的な事例を発掘します。
Zenn が主催する「AI Agent Hackathon with Google Cloud 」にご応募いただいたプロジェクトのうち、上位 3 位の最終ピッチ コンテストと他全ての賞の表彰式を実施いたします。
【お問い合わせ】Google Cloud イベント事務局Email : googlecloud-genai-japan@google.com#gcai_agent
この記事は Google Play プロダクト マーケティング マネージャー、Lloyd Hightowerによる Google for Developers の記事 " Announcing the Winners of the Gemini API Developer Competition!" を元に翻訳・加筆したものです。詳しくは元記事をご覧ください。
5 月の I/O で、Google は世界中の開発者のみなさんに Gemini API を活用した革新的なアプリの開発を呼びかけました。世界中の何千もの開発者の皆さんがこの呼びかけに応え、既存のアプリに AI を搭載した機能を追加し、可能性の限界を広げる AI のアプリを開発しました。
そして、みなさんが待ち望んでいた瞬間が訪れました:
Gemini API デベロッパー コンテストの受賞者を紹介します!日本からは 2 名の方が選出されました。
総合的なベスト アプリ : Jayu
AI 搭載のパーソナルアシスタント「Jayu」は、Gemini API とクリエイティブな開発の融合による可能性を実証しています。この革新的なアプリは、ウェブブラウザ、コードエディタ、音楽ストリーミング、ゲームなど、さまざまなアプリと統合されています。Jayu は、視覚情報を解釈することによって、アプリのインターフェースと直接対話してリアルタイムで翻訳する能力を持ち、Gemini API の力とその能力を最大限に引き出すクリエイターの卓越したスキルを同時に示します。Google にとって、Jayu は単なる受賞アプリではなく、AI が生活に統合され、働く未来の一端を垣間見ることができます。
Vite Vere は、認知障害を持つ人びとが日常的なタスクをこなすためのパーソナライズされたガイダンスを提供することで、より自立することを支援します。このアプリが Gemini の視覚的理解と巧みなプロンプトを使用して、ユーザーがタスクを完了できるよう段階的な指示を提供することで、自立とスキル開発を促進している点に感銘を受けました。
最もクリエイティブなアプリ : Outdraw AI (日本)
Outdraw は、創造性と AI のユニークな融合により、AI ならではのゲーム体験を可能にしました。このゲームは、ユーザーは人間には認識できて、AI の視覚理解では認識できない画像を描くという挑戦をユーザーに与えるゲームです。このアプリは、AI をコラボレーションパートナーから挑戦的な対戦相手に変えることで、クリエイティブな取り組みにおける AI の役割を再定義します。これは、AI の最も創造的な使用例の 1 つでした。
Prospera は、革新的な Flutter アプリで、Gemini API を活用してリアルタイムの AI セールスコーチを構築しています。セールス会話の分析と即時のフィードバックやパフォーマンス レポートを提供することで、Prospera は 営業担当者がスキルを向上させることを可能にします。このアプリは、実用的なビジネス課題に対処し、プロとしての成長を促進する Gemini モデルの汎用性を示しています。Prospera の詳細と、アプリの選出理由については、Flutter ブログ (英語) をご覧ください。
Gaze Link は、重度の運動障害と言語障害を発症した筋萎縮性側索硬化症(ALS)の患者の力を引き出す可能性を秘めており、私たちに感銘を与えました。この Android アプリは、眼球追跡技術とGemini API を使用して、介護者の質問を理解し、患者から生成された単一単語に基づいて完全な文章の応答を正確に予測および生成します。Gaze Link の詳細については、Android Developer ブログ (英語) をご覧ください。
Trippy は、Firebase と Gemini API を巧みに活用して、パーソナライズされた旅行計画体験を作り出すことで注目を集めました。このアプリは、Gemini の自然言語理解とレコメンド機能を活用して、ユーザーの好みをもとに目的地、アクティビティ、旅程を提案します。Trippy は、AI がどのように旅行計画を強化し、世界を探検するのをよりアクセスしやすく楽しいものにするかを示しています。Trippy の詳細については、Firebase ブログ (英語) をご覧ください。
ViddyScribe は、視覚障害者の方々がよりアクセスしやすくなるよう、動画に自動的に音声説明を追加するウェブ アプリです。このアプリは、Gemini モデルを使用して文脈的に正確な説明を生成し、視聴体験を妨げることなく動画にシームレスに統合します。ViddyScribe の詳細については、Chrome Developers ブログをご覧ください。
Pen Apple は、Gemini Flash モデル を巧みに活用して、ゲームプレイのインタラクションを迅速に解釈して実行するオンライン デッキ構築ゲームです。このゲームは、Gemini の自然言語処理能力を使用して、カードの効果を直接カード名から解釈します。これにより、最小限の開発努力で複雑で創造的なカードが可能になります。私たちは特に、Gemini API がゲームの背景設定、敵、ステージ、さらにはゲームの仕組みに統合される新しいカードの作成にも使用されている点にも感銘を受けました。
Everies は、Gemini API と ARCore を活用して、身の周りの物に命を吹き込みます。Gemini の視覚理解と高度なプロンプトを使用して、Everies は物ごとにユニークなスクリプトを作成し、ARCore を使用して顔の特徴を重ね合わせることで、革新的で楽しい方法で物に命を吹き込みます。
Gemini API で未来を構築する
これらのアプリは、さまざまな分野で画期的な問題を解決するための Gemini API の計り知れないな可能性を示しています。Google は、開発者の皆さんが Gemini の能力を活用して、今後さらにインパクトのある革新的なアプリを開発することを期待しています。Gemini を活用した開発を始めるには、Google AI Studio をご覧ください。
Reviewed by Tamao Imura - Developer Marketing Manager, Google Play
Google は、AI をあらゆる人にとって役立つものにすることを目指し、開発者コミュニティが独自の言語や文化に合わせて AI を活用し実装できることを目指しています。その一環として、今年の I/O では、インドの開発者が Gemma をファイン チューニングして、12 のインド言語でテキストを理解し生成することに成功した Navarasa (英語) プロジェクトを紹介しました。
これは、Gemma が言語や文化の違いを乗り越えて、さまざまな状況に対応できる可能性を示しています。このプロジェクトを含めて、Gemma の言語機能をさらに強化し、世界中の開発者のみなさんに提供できるよう取り組んでいます。
Gemma for Japan
本日、東京で開催された Gemma Developer Day で、日本語版 Gemma 2 2B を公開しました。Gemma 2 と比較して、優れた文章力と、指示内容を的確に理解し反映する能力など、全体的な品質が向上しています。本モデルと併せて、トレーニングガイドも公開し、世界中の開発者が Gemma を他言語に適応させるための実践的な例として支援をしてまいります。
日本語版 Gemma 2 2Bは、自社評価において、 GPT-3.5 を上回るパフォーマンスを発揮し、モバイル端末での高速でスムーズな処理能力や日英両言語における高い品質を維持しています。この優れた結果は、モデルのサイズを考慮すると、Gemma モデルが英語以外の言語でも高い性能を発揮できることを示すものと考えています。
AI リサーチへの支援
オープンモデルの世界は、私たちだけの力で成り立っているわけではありません。継続的な進歩と革新を推進するのは、コミュニティの力です。そのため Google は、 TPU Research Cloud プログラムや Google Cloud クレジットなどのプログラムを通じて、研究者の皆さんにコンピューティング リソースを提供できることを嬉しく思います。
また東京科学大学 情報理工学院 情報工学系の岡崎直観教授らの研究チームと協力し、日本におけるオープンモデルの開発支援、および、新しい技術の開拓への取り組みも進めます。
“Google の Gemma シリーズはコンパクトな大規模言語モデルであるにも関わらず、日本語と英語の能力をバランスよく備えています。多言語に強い Gemma の能力を活かしながら、日本の文化や知識に関する能力を引き上げる方法について、Google と一緒に取り組めることを楽しみにしています。”
岡崎直観 教授 - 東京科学大学
開発者コミュニティに参加できることを光栄に思い、研究機関の皆様とこの先も取り組みを続けていくことを楽しみにしています。
Kaggle でグローバル コミュニケーションを解き放つ
私たちの目標は、言語に関係なく、すべての人が Gemma にアクセスし、AI による革新的なサービスを享受できるようにすることです。その目標を達成するひとつの取り組みとして、 Kaggle コンペティションを開催しています。ぜひ日本の開発者の皆様にもご参加いただき、多言語向けの Gemma モデルの構築にご参加ください。
開発者のみなさまの力が、言語間の障壁を取り払い、世界中の人々をつなぎます。 私たちは、開発者 コミュニティとの密な連携を継続し、ともに、日本の AI の未来を形作っていきたいと考えています。
あなたは日本のサッカーコーチで、選手にペナルティキックのパフォーマンスについてフィードバックを行っていると想像してください。 スタイルスコアは、テクニックがどれだけすばらしいかを測定します。 超低スコアとは、55 以下のことを言います。 低スコアとは、56 ~ 65 以下のことを言います。 中スコアとは、66 ~ 75 のことを言います。 高スコアとは、76 ~ 85 のことを言います。 超高スコアとは、 86 以上のことを言います。 入力情報として、 「 今回の選手のキックデータ 」 、 「 三笘選手のキックの動画 」 、 「 今回の選手のキックの動画 」 、 「 三笘選手の名言が 25 語記載されたテキストデータ 」 を渡します。 この情報を元に選手へのフィードバックを行ってください。 「 今回の選手のキックデータ 」 を元に、選手の長所に焦点を当てて、プレーヤーに伝える励ましのフィードバックの文を書きます。 高スコアは長所なので、褒めてください。 低スコアは改善点なので、改善方法を教えます。但し、 「 さらに○○すると良い 」 というように指摘するだけにします。 スコアは数値で言及するのではなく、 99 の場合は 「 非常に強力 」 、 50 の場合は 「 さらにパワーを出しましょう 」 などと述べます。ポジティブなフィードバックをするので、個性的、独特などのワードは使わないようにしてください。
今年の Google I/O では、AI を活用した開発に役立つ新しい製品とツールを発表しました。また、デベロッパーの皆さんが、Google のツールの力を最大限に活用し、最も高性能な AI モデルをアプリやゲームに統合することで、ユーザーにとって素晴らしく革新的な体験を構築できるよう、Gemini API デベロッパー コンペティションを開始しました。このコンテストでは、カスタマイズした電気自動車バージョンのデロリアン(と多額の賞金)を獲得するチャンスがあります。
I/O クロスワードの遊び方
遊び方は次の通りです。
ステップ 1 : 4 つのマスコットからチームを選びましょう。選んだマスコットの色が、単語を解いたときにマスが変わる色になります。選んだチームの合計得点に各自のスコアが反映されます。
ステップ 2 : 次に、ボード上の好きな場所からスタートしましょう。
ステップ 3 : 単語が解けないときは、「ヒントを見る」ボタンを試してみてください。yes か no で回答できる質問を投げかけることで、解答に導きます。(最大 10 回まで)
ステップ 4 : 連続で単語を解くほど、リーダーボードの順位が (チームでも個人でも) 上がります!スコアを投稿し、Google Developer Program のプロフィール用バッジを獲得しましょう。
I/O クロスワードを作成することが目的だったので、今年の I/O でグーグルが発表した内容を元に、単語やヒントを作成したいと思いました。そこで、Gemini Advanced に YouTube 上にアップロードされている Google I/O の基調講演 3 時間分を読み込んでもらい、I/O の製品発表を楽しく学ぶための、時事的な技術関連の単語とヒントを作成してもらいました。
Gemini アプリは、Google の最先端のAI モデルを誰でもすぐに利用できるよう、会話型インターフェースを通じて提供しています。今回私たちが Gemini Advanced を活用した主な理由は、他の多くの LLM と比較しても、ナレッジ カットオフが直近で、最新の情報をインターネットから取得できるためです。
ゲームの UI は Flutter で構築されています。Flutter のプラットフォームに対する柔軟性とパフォーマンスの高さは、ダイナミックでインタラクティブなゲームを構築する上で最適な選択でした。クロスワード ボードをレンダリングし、スムーズなナビゲーションを可能にするために、Flutter の InteractiveViewer ウィジェット (英語) を採用しました。このウィジェットは、大きなコンテンツ エリアでのパンやズームといったユーザー インタラクションを処理するように設計されているため、広大なクロスワード グリッドを探索するのに理想的でした。 このゲームは、プレイヤーが同じボード上で同時にプレイするコラボレーション体験を提供しているため、優れたゲーム体験を可能にするにはパフォーマンスがとても重要です。そのため、このゲームは Google I/O (英語) で Flutter ウェブアプリの Stable チャンネルに移行した WebAssembly (WASM) にコンパイルされています。InteractiveViewer ウィジェット内での行列変換の使用や、WASM が高いフレームレートを維持するために、どのように役立ったかといったトピックについての詳細は、ブログ (英語) をご覧ください。
Firebase は、バックエンド機能を提供するため、クロス プラットフォームで動作するさまざまなツールを提供しています。稼働中のアプリケーションは Firebase Hosting でホストされ、アプリケーションからのすべてのデータは Firestore に保存されます。Firestore はリアルタイムで動作し、世界中のユーザーがパズルを完成させるとライブ アップデートが保存され、ユーザーがゲームに参加したり離脱したりすると自動的にスケーリングします。
クロスワードが完成すると、ボード全体がリセットされるため、ゲームは常にオン状態で、新しいユーザーが参加してもすぐにプレイできます。この機能は Cloud Functions for Firebase によって実現されています。 Flutter アプリが Firestore に直接アクセスする場合、App Check と anonymous auth を設定してリーダーボード API を保護し、認証されたユーザーだけがアクセスできるようにします。Firebase Authentication を使用すると、ゲームに参加するすべてのユーザーが匿名で認証され、個々のスコアを追跡し、リーダーボードに表示することができます。
Dart で構築されたバックエンドは、API コールの管理、データベースとの連携、Flutter アプリからのリクエスト処理を行います。Cloud Run は自動スケーリング機能を提供し、スムーズなユーザー エクスペリエンスを保証します。
不正行為を防ぐため、Dart Frog (英語) バックエンドを採用しています。アプリは Firestore からデータを読み込むことができますが、変更を加えることができるのは Dart Frog バックエンドのみです。このアーキテクチャと認証メカニズムにより、フェアプレーが保証されます。
遊んでみよう
I/O クロスワードを実際に体験してください。ご興味のある方のために、コードはオープンソース化されています。私たちは、この事例を Gemini API デベロッパー コンテストで、皆さんの作品に活かしていただけることを楽しみにしています。 開発を始めるにあたって、開発プロセスをサポートするためのコンテンツ (英語) をご用意しました。ぜひご覧ください。