+
Skip to content

Các mô hình ngôn ngữ lớn (Large Language Models - LLMs) như GPT, LLaMA hay DeepSeek đã trở thành một trong những thành tựu quan trọng nhất của trí tuệ nhân tạo hiện đại. Chúng được phát triển thông qua quá trình huấn luyện trên lượng dữ liệu khổng lồ, sử dụng kiến trúc học sâu.

License

Notifications You must be signed in to change notification settings

aerovfx/Aero-HowtoLLMs

Repository files navigation

Quy trình phát triển mô hình ngôn ngữ lớn LLMs

Kho lưu trữ này chứa mã nguồn để phát triển, tiền huấn luyện và tinh chỉnh một mô hình ngôn ngữ lớn (LLM) giống GPT và là kho mã chính thức cho cuốn sách [Quy trình phát triển mô hình ngôn ngữ lớn LLMs]




Trong [Quy trình phát triển mô hình ngôn ngữ lớn LLMs], bạn sẽ học và hiểu cách các mô hình ngôn ngữ lớn (LLMs) hoạt động từ bên trong bằng cách mã hóa chúng từ đầu, từng bước một. Trong cuốn sách này, tôi sẽ hướng dẫn bạn tạo ra LLM của riêng mình, giải thích từng giai đoạn với văn bản rõ ràng, sơ đồ và ví dụ.

Phương pháp được mô tả trong cuốn sách này để huấn luyện và phát triển mô hình nhỏ nhưng chức năng cho mục đích giáo dục phản ánh cách tiếp cận được sử dụng trong việc tạo ra các mô hình nền tảng quy mô lớn như những mô hình đằng sau ChatGPT. Ngoài ra, cuốn sách này còn bao gồm mã để tải trọng số của các mô hình đã được tiền huấn luyện lớn hơn để tinh chỉnh.

<<<<<<< HEAD



Để tải bản sao của kho lưu trữ này,thực hiện lệnh sau trong terminal của bạn:

git clone --depth 1 https://github.com/aerovfx/Aero-HowtoLLMs

Mục lục

Xin lưu ý rằng tệp README.md này là tệp Markdown (.md). Nếu bạn đã tải gói mã này từ trang web của Manning và đang xem nó trên máy tính của mình, tôi khuyên bạn nên sử dụng trình soạn thảo hoặc trình xem trước Markdown để xem đúng cách. Nếu bạn chưa cài đặt trình soạn thảo Markdown, MarkText là một lựa chọn miễn phí tốt.



Tip

Nếu bạn đang tìm kiếm hướng dẫn về cài đặt Python và các gói Python cũng như thiết lập môi trường mã, tôi đề xuất đọc tệp README.md nằm trong thư mục setup.



Kiểm tra mã (Linux) Kiểm tra mã (Windows) Kiểm tra mã (macOS)


Tiêu đề chương Mã chính (truy cập nhanh) Tất cả mã + bổ sung
Khuyến nghị thiết lập - -
Ch 1: Hiểu về các mô hình ngôn ngữ lớn Không có mã -
Ch 2: Làm việc với dữ liệu văn bản - ch02.ipynb
- dataloader.ipynb (tóm tắt)
- exercise-solutions.ipynb
./ch02
Ch 3: Mã hóa cơ chế chú ý - ch03.ipynb
- multihead-attention.ipynb (tóm tắt)
- exercise-solutions.ipynb
./ch03
Ch 4: Triển khai mô hình GPT từ đầu - ch04.ipynb
- gpt.py (tóm tắt)
- exercise-solutions.ipynb
./ch04
Ch 5: Tiền huấn luyện trên dữ liệu không gán nhãn - ch05.ipynb
- gpt_train.py (tóm tắt)
- gpt_generate.py (tóm tắt)
- exercise-solutions.ipynb
./ch05
Ch 6: Tinh chỉnh cho phân loại văn bản - ch06.ipynb
- gpt_class_finetune.py
- exercise-solutions.ipynb
./ch06
Ch 7: Tinh chỉnh để làm theo hướng dẫn - ch07.ipynb
- gpt_instruction_finetuning.py (tóm tắt)
- ollama_evaluate.py (tóm tắt)
- exercise-solutions.ipynb
./ch07
Phụ lục A: Giới thiệu về PyTorch - code-part1.ipynb
- code-part2.ipynb
- DDP-script.py
- exercise-solutions.ipynb
./appendix-A
Phụ lục B: Tài liệu tham khảo và đọc thêm Không có mã -
Phụ lục C: Giải pháp bài tập Không có mã -
Phụ lục D: Thêm các tính năng vào vòng lặp huấn luyện - appendix-D.ipynb ./appendix-D
Phụ lục E: Tinh chỉnh hiệu quả với LoRA - appendix-E.ipynb ./appendix-E

 

Mô hình tinh thần dưới đây tóm tắt các nội dung được đề cập trong cuốn sách này.


 

Yêu cầu phần cứng

Mã trong các chương chính của cuốn sách này được thiết kế để chạy trên các máy tính xách tay thông thường trong thời gian hợp lý và không yêu cầu phần cứng chuyên dụng. Cách tiếp cận này đảm bảo rằng một lượng lớn độc giả có thể tham gia vào tài liệu. Ngoài ra, mã tự động sử dụng GPU nếu có sẵn. (Vui lòng xem tài liệu setup để biết thêm các khuyến nghị.)

 

Tài liệu bổ sung

Một số thư mục chứa tài liệu tùy chọn như một phần thưởng cho các độc giả quan tâm:


  ======= Kết luận Việc xây dựng một mô hình ngôn ngữ lớn là một quá trình phức tạp, đòi hỏi sự kết hợp của nhiều công nghệ tiên tiến và nguồn lực tính toán lớn. Sự phát triển của LLMs mở ra nhiều cơ hội trong các lĩnh vực như trợ lý ảo, sáng tạo nội dung, dịch thuật, và nghiên cứu khoa học, nhưng cũng đặt ra nhiều thách thức về kiểm soát và đạo đức trong AI.

LLMs in production

Overview of LLMs in Production

AI Application + Data Products

  • Q&A Webapp
  • Chatbot
  • Model as an API

LLM Pipeline

  • Corpus Creation
  • Text Pre Processing
  • Prompt Engineering
  • LLM Inference
  • Generated Text

LLM Model(s)

  • GPT 3.5
  • GPT 4.0
  • LLaMA
  • Hugging Face
  • MPT

ab450f3d2e36437ab263df67da2a0772d02798e2

About

Các mô hình ngôn ngữ lớn (Large Language Models - LLMs) như GPT, LLaMA hay DeepSeek đã trở thành một trong những thành tựu quan trọng nhất của trí tuệ nhân tạo hiện đại. Chúng được phát triển thông qua quá trình huấn luyện trên lượng dữ liệu khổng lồ, sử dụng kiến trúc học sâu.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  
点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载