5. AI hoạt động như thế nào
Sau khi hiểu về Transformer, nhiều người thường đặt ra một câu hỏi rất tự nhiên:
AI thực sự hoạt động như thế nào?
Nó có thật sự “suy nghĩ” giống con người không?
Hay nó chỉ là một cỗ máy phức tạp đang làm những phép tính?
Để hiểu điều này, chúng ta không cần đi vào toán học phức tạp.
Chỉ cần hiểu ba ý tưởng đơn giản:
- Dữ liệu
- Huấn luyện
- Dự đoán
Ba bước này tạo nên hầu hết các hệ thống AI hiện đại.
1. DỮ LIỆU – THỨ MÀ AI HỌC TỪ ĐÓ
Hãy tưởng tượng một đứa trẻ đang học nói.
Trong những năm đầu đời, đứa trẻ nghe:
- cha mẹ nói chuyện
- người xung quanh nói chuyện
- phim ảnh
- câu chuyện
- bài hát
Mỗi ngày, nó nghe hàng nghìn câu nói.
Sau vài năm, bộ não bắt đầu hiểu:
- từ nào thường đi cùng nhau
- câu nào nghe tự nhiên
- câu nào nghe kỳ lạ
Đứa trẻ không học bằng cách đọc sách ngữ pháp trước.
Nó học bằng cách nghe rất nhiều ví dụ.
AI cũng học gần giống như vậy.
AI học từ những gì?
Các hệ thống AI hiện đại được “đọc” một lượng dữ liệu khổng lồ:
- sách
- bài báo
- trang web
- tài liệu khoa học
- hội thoại
- mã lập trình
Khối lượng dữ liệu này có thể lên đến:
hàng trăm tỷ câu văn.
Nếu in ra giấy, số sách đó có thể cao bằng nhiều tòa nhà chọc trời.
AI không hiểu thế giới như con người.
Nhưng nó có một lợi thế:
nó đã “đọc” nhiều hơn bất kỳ con người nào trong lịch sử.
2. HUẤN LUYỆN – CÁCH AI HỌC
Bây giờ hãy tưởng tượng một trò chơi.
Máy tính được đưa cho một câu:
“Hôm nay trời rất …”
Nó phải đoán từ tiếp theo.
Ví dụ:
- đẹp
- lạnh
- nóng
- mưa
Lúc đầu, AI đoán gần như ngẫu nhiên.
Nó sai rất nhiều.
Nhưng mỗi lần sai, hệ thống sẽ điều chỉnh một chút.
Giống như học sinh sửa bài sau khi làm sai.
Sau hàng tỷ lần thử, hệ thống bắt đầu nhận ra:
- “trời rất đẹp” xuất hiện nhiều
- “trời rất lạnh” cũng phổ biến
- “trời rất bánh mì” gần như không tồn tại
Dần dần, AI trở nên rất giỏi trong việc đoán từ tiếp theo.
Quá trình luyện tập này được gọi là:
huấn luyện.
Một quá trình cực kỳ dài
Việc huấn luyện một hệ thống AI lớn có thể kéo dài:
- nhiều tuần
- hoặc nhiều tháng
và sử dụng:
- hàng nghìn máy tính mạnh
- lượng điện năng khổng lồ
Trong thời gian đó, hệ thống liên tục:
- đọc dữ liệu
- đoán
- sai
- sửa lại
lặp đi lặp lại hàng nghìn tỷ lần.
Sau quá trình này, AI không còn đoán ngẫu nhiên nữa.
Nó bắt đầu đoán rất chính xác.
3. DỰ ĐOÁN – KHI AI TRẢ LỜI BẠN
Khi bạn hỏi ChatGPT một câu hỏi, điều gì xảy ra?
Ví dụ bạn viết:
“Thủ đô của Nhật Bản là …”
AI sẽ bắt đầu đoán từ tiếp theo.
Nó tính toán xác suất của nhiều từ:
- Tokyo
- Osaka
- Kyoto
Và nó chọn từ có khả năng cao nhất:
Tokyo
Sau đó nó tiếp tục đoán từ tiếp theo:
“Thủ đô của Nhật Bản là Tokyo.”
Rồi tiếp tục tạo câu tiếp theo.
Toàn bộ câu trả lời của AI được tạo ra bằng cách:
dự đoán từng từ một.
AI KHÔNG VIẾT MỘT LẦN
Một điều rất thú vị là:
AI không viết cả đoạn văn cùng lúc.
Nó viết:
từ thứ nhất → từ thứ hai → từ thứ ba
từng bước một.
Giống như cách bạn nói chuyện.
VÌ SAO AI CÓ THỂ TRẢ LỜI NHIỀU CÂU HỎI KHÁC NHAU?
Bởi vì trong quá trình huấn luyện, AI đã đọc rất nhiều loại văn bản khác nhau:
- lịch sử
- khoa học
- văn học
- lập trình
- triết học
Khi bạn đặt câu hỏi, hệ thống sẽ tìm trong “trí nhớ thống kê” của nó:
những mẫu câu giống nhất.
Sau đó nó tạo ra câu trả lời mới.
AI GIỐNG MỘT NGƯỜI ĐỌC HÀNG TỶ CUỐN SÁCH
Một cách đơn giản để hiểu AI là tưởng tượng:
có một người đã đọc:
- hàng tỷ cuốn sách
- hàng tỷ cuộc hội thoại
Người đó có thể không nhớ chính xác từng câu.
Nhưng họ nhớ:
- cách con người thường nói
- cách các ý tưởng thường được trình bày
Khi bạn hỏi họ một câu hỏi, họ có thể:
- ghép các ý tưởng lại
- tạo ra một câu trả lời hợp lý
AI hoạt động khá giống như vậy.
AI CÓ THẬT SỰ HIỂU KHÔNG?
Đây là một câu hỏi lớn.
Một số nhà khoa học cho rằng:
AI chỉ đang dự đoán từ.
Nó không thực sự hiểu ý nghĩa sâu xa của thế giới.
Nhưng những người khác cho rằng:
khi một hệ thống có thể xử lý lượng thông tin khổng lồ như vậy,
nó có thể bắt đầu hình thành một dạng hiểu biết mới.
Cuộc tranh luận này vẫn đang tiếp tục.
BA Ý TƯỞNG QUAN TRỌNG
Chúng ta có thể tóm tắt hoạt động của AI bằng ba bước rất đơn giản:
1. Dữ liệu
AI đọc một lượng văn bản khổng lồ.
2. Huấn luyện
AI luyện tập dự đoán từ tiếp theo hàng nghìn tỷ lần.
3. Dự đoán
Khi bạn hỏi, AI tiếp tục trò chơi đoán từ đó để tạo câu trả lời.
MỘT CỖ MÁY DỰ ĐOÁN KHỔNG LỒ
Điều nghe có vẻ đáng ngạc nhiên là:
rất nhiều khả năng của AI hiện đại
đến từ một ý tưởng cực kỳ đơn giản:
dự đoán điều gì sẽ xảy ra tiếp theo.
Nhưng khi ý tưởng này được áp dụng trên:
- dữ liệu khổng lồ
- máy tính cực mạnh
- các mô hình như Transformer
nó tạo ra những hệ thống có vẻ như:
- viết văn
- làm thơ
- lập trình
- trả lời câu hỏi
- thậm chí trò chuyện như con người
Và đó là lý do vì sao ngày nay nhiều người cảm thấy:
máy móc dường như đã bắt đầu suy nghĩ.