โหมดตัวแทน

โหมดเอเจนต์ของ Gemini ใน Android Studio ออกแบบมาเพื่อจัดการงานพัฒนาที่ซับซ้อนและมีหลายขั้นตอน ซึ่งมากกว่าที่คุณจะทำได้เพียงแค่แชทกับ Gemini คุณสามารถอธิบายเป้าหมายระดับสูง แล้วเอเจนต์จะสร้างและ ดำเนินการตามแผน โดยเรียกใช้เครื่องมือที่จำเป็น ทำการเปลี่ยนแปลง ในหลายไฟล์ และแก้ไขข้อบกพร่องซ้ำๆ ขั้นตอนการทำงานที่ได้รับความช่วยเหลือจากตัวแทนนี้ ช่วยให้คุณรับมือกับความท้าทายที่ซับซ้อนและเร่งกระบวนการพัฒนา ได้

ข้อกำหนดของระบบ

โหมดตัวแทนพร้อมใช้งานใน Gemini สำหรับบุคคลทั่วไปโดยเริ่มจาก Android Studio Narwhal Feature Drop Canary 4 โหมดตัวแทนพร้อมให้บริการใน Gemini สำหรับธุรกิจ โดยเริ่มใน Android Studio Narwhal Feature Drop Canary 7 ดาวน์โหลด Android Studio เวอร์ชันตัวอย่างล่าสุด

เริ่มต้นใช้งาน

หากต้องการเริ่มต้นใช้งานในโหมดตัวแทนใน Android Studio ให้ทำตามขั้นตอนต่อไปนี้

  1. คลิก Gemini ในแถบด้านข้าง ลงชื่อเข้าใช้และเริ่มต้นใช้งานหากจำเป็น
  2. เลือกแท็บตัวแทน
  3. อธิบายงานที่คุณต้องการให้เอเจนต์ดำเนินการ
  4. เมื่อตัวแทนทำตามขั้นตอนเพื่อทำงานให้เสร็จ คุณจะมี ตัวเลือกในการตรวจสอบและอนุมัติการเปลี่ยนแปลง

    โหมดตัวแทนจะรอให้คุณยอมรับหรือปฏิเสธการเปลี่ยนแปลง
  5. ไม่บังคับ: หากต้องการอนุมัติการเปลี่ยนแปลงโดยอัตโนมัติ ให้เลือกตัวเลือกเอเจนต์ > อนุมัติการเปลี่ยนแปลงโดยอัตโนมัติ

    อนุมัติการเปลี่ยนแปลงที่เอเจนต์แนะนำโดยอัตโนมัติ

กรณีการใช้งาน

ตัวอย่างกรณีการใช้งานที่ตัวแทนช่วยคุณได้มีดังนี้

  • แก้ไขข้อผิดพลาดในการสร้าง เมื่อคุณขอให้ตัวแทนแก้ไขข้อผิดพลาดในการบิลด์โดยใช้พรอมต์ เช่น "แก้ไขข้อผิดพลาดในการบิลด์ในโปรเจ็กต์ของฉัน" ตัวแทนจะใช้การแก้ไขที่แนะนำ บิลด์ โปรเจ็กต์เพื่อยืนยันโซลูชัน และทำซ้ำจนกว่าปัญหาจะได้รับการแก้ไข

    เอเจนต์จะสร้างโปรเจ็กต์และประเมินว่ามีข้อผิดพลาดหรือไม่
  • โหมดเอเจนต์สามารถเพิ่มหรืออัปเดตองค์ประกอบ UI ได้ด้วยตัวเอง เช่น ขอให้ เอเจนต์ "ตั้งค่าดาร์กโหมดเป็นค่าเริ่มต้นในการตั้งค่าของผู้ใช้" แล้วเอเจนต์จะค้นหา ไฟล์ที่เกี่ยวข้องและแนะนำการเปลี่ยนแปลงเพื่อให้งานสำเร็จ คุณดูตัวอย่างการอัปเดต UI ได้ทันทีในหน้าต่างเครื่องมืออุปกรณ์ที่ทำงานอยู่

  • การมีข้อมูลจำลองจะเป็นประโยชน์เมื่อสร้างต้นแบบและทดสอบแอป คุณสามารถมอบหมายงานนี้ให้กับเอเจนต์แทนที่จะสร้างข้อมูลปลอมด้วยตนเอง ในที่นี้ เราได้ขอให้เอเจนต์ "เพิ่มเซสชันอีก 2 รายการลงในข้อมูลปลอม" โดยจะค้นหาไฟล์ที่เกี่ยวข้องและเพิ่มเหตุการณ์อีก 2 รายการลงในรายการ mockSessions

พรอมต์อื่นๆ ที่ควรลองใช้

  • "เขียนการทดสอบหน่วยสำหรับ <class> ใน <module>"
  • "สร้างเอกสารสำหรับไฟล์ที่เปิดอยู่"
  • "เปลี่ยนชื่อแอปจาก <ชื่อปัจจุบัน> เป็น <ชื่อใหม่>"
  • "แก้ไขข้อยกเว้นตัวชี้ Null"
  • "ปรับโครงสร้างโค้ดโดยย้าย Composable <ชื่อ Composable> ไปยังไฟล์ใหม่ ตรวจสอบว่าได้อัปเดตการนำเข้าทั้งหมดแล้ว"
  • "เพิ่มปุ่มใหม่ลงในหน้าจอหลักของแอปชื่อ "ติดตาม" ซึ่งจะนำคุณไปยัง รายการหัวข้อ"
  • "ใน Composable <ชื่อ Composable> ให้ลดระยะขอบของตัวแก้ไข <ชื่อตัวแก้ไข modifier>"
  • "สร้างปุ่มแชร์เพื่อแชร์ไปยังโซเชียลมีเดีย"

เพิ่มคีย์ Gemini API

โหมดตัวแทนเริ่มต้นใน Android Studio มีโควต้าแบบไม่มีค่าใช้จ่ายรายวันที่มีหน้าต่างบริบทแบบจำกัด หากต้องการขยายหน้าต่างบริบท คุณสามารถเพิ่มคีย์ Gemini API ของคุณเองเพื่อใช้ประโยชน์จากโทเค็นสูงสุด 1 ล้านโทเค็นด้วย Gemini 2.5 Pro

เพิ่มคีย์ API ของคุณเองเพื่อขยายหน้าต่างบริบท

หน้าต่างบริบทที่ใหญ่ขึ้นช่วยให้คุณส่งคำสั่ง โค้ด และไฟล์แนบ ไปยัง Gemini ได้มากขึ้น ซึ่งจะช่วยให้ได้คำตอบที่มีคุณภาพสูงยิ่งขึ้น ซึ่งมีประโยชน์อย่างยิ่ง เมื่อทำงานร่วมกับเอเจนต์ เนื่องจากบริบทที่ใหญ่ขึ้นจะช่วยให้ Gemini 2.5 Pro สามารถให้เหตุผลเกี่ยวกับงานที่ซับซ้อนหรือใช้เวลานานได้

วิธีรับคีย์ API

  1. ลงชื่อเข้าใช้ Google AI Studio แล้ว รับคีย์โดยคลิกปุ่มรับคีย์ API
  2. ใน Android Studio ให้ไปที่ไฟล์ (Android Studio ใน macOS) > การตั้งค่า > เครื่องมือ > Gemini เพื่อป้อนคีย์ API ของ Gemini
  3. เปิดตัว Gemini ใน Android Studio อีกครั้งและรับคำตอบที่ดียิ่งขึ้นจากโหมดตัวแทน
เพิ่มคีย์ API ของคุณเองในการตั้งค่า Gemini

โปรดดูแลคีย์ Gemini API ให้ดี เนื่องจาก จะมีการเรียกเก็บค่าใช้จ่ายเพิ่มเติมสำหรับ การใช้งาน Gemini API ที่เชื่อมโยงกับคีย์ API ส่วนตัว คุณตรวจสอบการใช้คีย์ API ของ Gemini ใน AI Studio ได้โดยไปที่รับคีย์ API > การใช้งานและการเรียกเก็บเงิน

เพิ่มเซิร์ฟเวอร์ MCP

เอเจนต์ของ Gemini ใน Android Studio สามารถโต้ตอบกับเครื่องมือภายนอกได้โดยใช้โปรโตคอลบริบทของโมเดล (MCP) ฟีเจอร์นี้ช่วยให้โหมดตัวแทนมีวิธีที่ได้มาตรฐานในการใช้เครื่องมือและขยาย ความรู้และความสามารถกับสภาพแวดล้อมภายนอก

คุณเชื่อมต่อเครื่องมือต่างๆ กับโฮสต์ MCP ใน Android Studio ได้ เช่น คุณสามารถผสานรวมกับเซิร์ฟเวอร์ MCP ของ Github เพื่อสร้างคำขอดึงข้อมูลจาก Android Studio ได้โดยตรง ดูแนวคิดเพิ่มเติมได้ที่ เซิร์ฟเวอร์ตัวอย่าง MCP

หากต้องการเพิ่มเซิร์ฟเวอร์ MCP ให้สร้างไฟล์ mcp.json แล้ววางไว้ในไดเรกทอรีการกำหนดค่าของ Studio mcp.json ไฟล์ควรมีรูปแบบดังนี้

{
  "mcpServers": {
    "memory": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-memory"
      ]
    },
    "sequential-thinking": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-sequential-thinking"
      ]
    },
    "github": {
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "GITHUB_PERSONAL_ACCESS_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_PERSONAL_ACCESS_TOKEN": "<YOUR_TOKEN>"
      }
    }
  }
}

โปรดดูเอกสารประกอบสำหรับเซิร์ฟเวอร์ MCP ที่คุณผสานรวมด้วยเพื่อดูcommandและargsที่แน่นอนซึ่งคุณควรระบุไว้ในไฟล์นี้ นอกจากนี้ คุณอาจต้องติดตั้งเครื่องมือต่างๆ เช่น Node.js หรือ Docker ทั้งนี้ขึ้นอยู่กับข้อกำหนดด้านซอฟต์แวร์ของเซิร์ฟเวอร์ MCP

ข้อจำกัด

การผสานรวม MCP ของ Android Studio มีข้อจำกัดที่สำคัญบางประการ ดังนี้

  • เซิร์ฟเวอร์ MCP ต้องใช้การรับส่ง stdio
  • ระบบยังไม่รองรับฟังก์ชันการทำงานต่อไปนี้
    • การรับส่ง HTTP แบบสตรีมมิง
    • แหล่งข้อมูล MCP
    • เทมเพลตพรอมต์

วิธีการทำงานของเอเจนต์

ในโหมดตัวแทน ระบบจะส่งพรอมต์ของคุณไปยัง Gemini API พร้อมกับรายการเครื่องมือที่พร้อมใช้งาน คุณสามารถคิดว่าเครื่องมือเป็นทักษะได้ โดยเครื่องมือจะรวมถึงความสามารถในการ ค้นหาไฟล์ อ่านไฟล์ ค้นหาข้อความภายในไฟล์ ใช้เซิร์ฟเวอร์ MCP ที่คุณกำหนดค่าไว้ และอื่นๆ

เมื่อคุณมอบหมายงานให้ Agent แล้ว Agent จะวางแผนและพิจารณาว่าต้องใช้เครื่องมือใด เครื่องมือบางอย่างอาจกำหนดให้คุณต้องให้สิทธิ์ก่อน ที่เอเจนต์จะใช้ได้ เมื่อคุณให้สิทธิ์แล้ว เอเจนต์จะใช้เครื่องมือเพื่อ ดำเนินการที่จำเป็นและส่งผลลัพธ์กลับไปยัง Gemini API Gemini จะประมวลผลผลลัพธ์ของการดำเนินการและสร้างคำตอบอื่น วงจรการ ดำเนินการและการประเมินนี้จะดำเนินต่อไปจนกว่างานจะเสร็จสมบูรณ์