Với nhiều người, AI là 1 lĩnh vực khó tiếp cận, hàn lâm và khô khan. Hiểu được điều đó, AI vỉa hè được sinh ra nhằm giúp các độc giả có 1 cách tiếp cận mới với AI. Các bài viết trong mục này phần lớn sẽ dưới dạng hỏi và đáp 1 cách ngắn gọn như đang nói chuyện ở trà đá vỉa hè. Phần còn lại sẽ tập trung giải thích và demo cho ae.
Bài viết này sẽ giới thiệu tổng quan và lĩnh vực trí tuệ nhân tạo, học máy, và ứng dụng của chúng trong đời sống hằng ngày. Đồng thời giải đáp một số thắc mắc về lĩnh vực AI nói chung và học sâu nói riêng.
Trí tuệ nhân tạo và một số thuật ngữ thường gặp.
Trí tuệ nhân tạo là gì?
A: Trí tuệ nhân tạo là cụm từ được dùng để chỉ tới việc tạo ra máy móc mô phỏng trí tuệ của con người, được lập trình để suy nghĩ, suy luận như con người. Ngoài ra, AI cũng có thể làm những thứ được cho là “thông minh”.
Ngày nay, AI len lỏi khắp các ngóc ngách của cuộc sống, từ việc có thể chơi cờ thắng đại kiện tướng, cho đến việc hỗ trợ bác sĩ chẩn đoán bệnh ung thư, hỗ trợ các nhà mô giới dự đoán giá nhà bất động sản hay tự động đề xuất Thiên Lý ơi ngay sau khi bạn xem MV Đừng làm trái tim anh đau dù 2 MV không cùng ca sĩ.
Q: Trí tuệ nhân tạo khác gì với những thuật toán thông thường?
A: Thuật toán thông thường quy định trình từ trước các bước để giải quyết một bài toán cụ thể nào đó. Trong khi đó, hệ thống Trí tuệ nhân tạo sử dụng thuật toán kết hợp với dữ liệu khổng lồ để giải nhận diện, ra quyết định và tự cải tiến theo thời gian khi dữ liệu lớn lên.
Học máy, học sâu là gì? Có phải là AI không?
A: Học máy chính là một nhánh của Trí tuệ nhân tạo có thể tự cải tiến (học) miễn là có thêm dữ liệu theo thời gian.
A: Học sâu là một lĩnh vực của học máy sử dụng mạng Nơ-ron thần kinh (Neural network) để học từ dữ liệu khổng lồ. Mạng Nơ-ron được gồm nhiều Nơ-ron nhân tạo liên kết với nhau. Mô hình học sâu có thể nhận diện rất nhiều mẫu (pattern) phức tạp từ hình ảnh, âm thanh, video dựa trên những gì được học.
A: Học máy và học sâu chính là một lĩnh vực của AI.
Q: Khoan, vậy ngoài nhánh học sâu (Deep Learning), học máy (Machine Learning) còn có gì?
A: Những thuật toán có thể tự học và cải tiến theo thời gian miễn là dữ liệu được mở rộng mà không sử dụng Neural Network chính là phần còn lại của Machine Learning, tiêu biểu có thể kể đến cây quyết định (Decision tree), Mạng Bayes (BayesNet), Support Vector Machine (tạm dịch máy hỗ trợ vector), hồi quy.
Q: Lúc nãy ông có nói học máy là 1 nhánh của Trí tuệ nhân tạo. Vậy ngoài học máy, Trí tuệ nhân tạo còn có gì?
A: Chúng là những chương trình có khả năng suy nghĩ, hành động và thích nghi hợp lý. Chúng là những thuật toán tìm đường, tối đa lợi ích và giảm thiểu thiệt hại (min-max), tìm cách thỏa mãn ràng buộc được cho. Rất nhiều trong số chúng xử lý tối ưu hoặc gần tối ưu nếu tri thức không chắc chắn, chúng thậm chí còn thông minh hơn con người.
Mạng Nơ-ron nhân tạo là gì?
A: Như đã giải thích ở trên, Mạng Nơ-ron nhân tạo (ANN) gồm các Nơ-ron liên kết với nhau. Mô hình này được lấy cảm hứng từ bộ não người , bắt chước cách Nơ-ron còn người truyền tín hiệu tới Nơ-ron khác. Mạng Nơ-ron nhân tạo chính là linh hồn của học sâu.
Q: Các Nơ-ron liên kết với nhau như thế nào? Là ngẫu nhiên hay có trật tự?
A: Có rất nhiều mạng Nơ-ron nhân tạo khác nhau. Trong các mạng Nơ-ron, các Nơ-ron được liên kết với nhau thông qua trọng số. Các trọng số này phải học thì mới có được, chúng sẽ được tối ưu khi train. Nơ-ron thông qua trọng số sẽ truyền được thông tin tới các Nơ-ron khác. Tại đây, Nơ-ron tổng hợp thông tin, tính toán và tiếp tục truyền thông tin. Cho đến lớp cuối cùng, các Nơ-ron sẽ tổng hợp lại và trả kết quả.
Thông thường, mạng Nơ-ron nhân tạo sẽ liên kết có trật tự, tuy nhiên trong một số hiếm kiến trúc mạng Nơ-ron đặc thù phụ thuộc vào dữ liệu, chúng có thể lặp lại liên kết hoặc liên kết ngẫu nhiên.
Và nhiều thuật ngữ khác
Một số thuật ngữ thường gặp về AI.
Thuật ngữ | Tạm dịch | Giải thích | Nằm trong |
---|---|---|---|
Layer | Lớp | 1 Layer gồm tập hợp nhiều nơ-ron nằm trên cùng 1 lớp. | Thành phần Neural Network |
Weight | Trọng số | Tham số mạng nơ-ron quyết định xem các nơ-ron liên kết với nhau mạnh hay yếu | Thành phần Neural Network |
Bias | Hệ số tự do | Hằng số bổ sung vào nơ-ron trước khi chuyển tới hàm kích hoạt | Thành phần Neural Network |
Activation Function | Hàm kích hoạt | Hàm toán học quyết định đầu ra của nơ-ron. VD: ReLU, Sigmoid, Tanh | Thành phần Neural Network |
Convolutional Neural Network (CNN) | Mạng Nơ-ron tích chập | Mạng nơ-ron được thiết kế để xử lý dữ liệu không gian, đặc biệt là hình ảnh | Phân loại Neural Network |
Recurrent Neural Network (RNN) | Mạng Nơ-ron hồi quy | Mạng nơ-ron đặc thù cho dữ liệu có trình tự, chẳng hạn như thời gian thực, ngôn ngữ | Phân loại Neural Network |
Generative Adversarial Network (GAN) | Mạng tạo sinh đối nghịch | 2 mô hình mạng nơ-ron (phân biệt và tạo sinh) đối kháng với nhau để tạo ra dữ liệu thật | Phân loại Neural Network |
Transformer | Bộ chuyển đổi | Kiến trúc mạng nơ-ron sử dụng cơ chế self-attention, thường dùng để xử lý ngôn ngữ tự nhiên. | Phân loại Neural Network |
Dataset | Tập dữ liệu | Tập hợp dữ liệu dùng để huấn luyện và kiểm tra mô hình học máy | Dữ liệu |
Training Set | Tập dữ liệu huấn luyện | Tập dữ liệu dùng để huấn luyện mô hình học máy. | Dữ liệu |
Validation Set | Tập dữ liệu kiểm chứng | Tập dữ liệu dùng để kiểm chứng mô hình học máy | Dữ liệu |
Overfitting | Quá khớp | Tình trạng mô hình học quá khớp với dữ liệu huấn luyện kể cả dữ liệu nhiễu, dẫn tới việc kém hiệu quả với dữ liệu mới | Dữ liệu |
Underfitting | Chưa khớp | Tình trạng mô hình quá đơn giản, không khớp với mô hình thực tế. | Dữ liệu |
Accuracy | Độ chính xác | Tỉ lệ giữa dự đoán chính xác và tổng dự đoán | Độ hiệu quả |
Precision | Độ chụm | Tỉ lệ giữa dự đoán chính xác nhãn dương và tổng dự đoán nhãn dương. | Độ hiệu quả |
Recall | Độ thu hồi | Tỉ lệ giữa dự đoán nhãn dương và dữ liệu dương thực tế | Độ hiệu quả |
Loss Function | Hàm mất mát | Hàm để đánh giá mức tương đồng giữa mô hình và dữ liệu thực tế. VD: MSE, Cross-Entropy. | Độ hiệu quả |
Backpropogation | Lan truyền ngược | Quá trình huấn luyện mạng nơ-ron thông qua việc lan truyền sai số ngược về để thay đổi lại trọng số. | Học, tối ưu |
Batch Size | Kích thước mẫu | Lượng dữ liệu huấn luyện được xử lý trước khi cập nhật tham số của mô hình. | Học, tối ưu |
Epoch | Chu kỳ huấn luyện | 1 epoch = 1 lần duyệt qua toàn bộ dữ liệu huấn luyện | Học, tối ưu |
Gradient Descent | Giảm dốc | Kỹ thuật tối ưu sử dụng để giảm thiểu hàm tổn thất thông qua việc liên tục điều chỉnh trọng số. | Học, tối ưu |
Làm thế nào các mô hình Machine Learning có thể “học”?
A: Các mô hình có thể học là nhờ khả năng tự cải thiện độ chính xác. Bản chất các mô hình học máy là tìm cách “bắt chước” dữ liệu thực tế hết mức có thể. Các mô hình sẽ khởi đầu với các tham số ngẫu nhiên, tính toán sự khác biệt khi áp dụng mô hình so với thực tế để điều chỉnh tham số. Qua mỗi bước, khoảng cách giữa áp dụng mô hình học máy và dữ liệu thực được thu hẹp. Khi dữ liệu huấn luyện được bổ sung, mô hình có thể học mà không cần con người phải hướng dẫn thêm.
Học có giám sát và học không giám sát là sao?
A: Học có giám sát là kỹ thuật học máy sử dụng tập dữ liệu được gắn nhãn. Dữ liệu gán nhãn có thể coi là giám thị để kiểm tra xem mô hình có chính xác hay không. Trong khi đó, học không giám sát lại sử dụng dữ liệu gom cụm không được gán nhãn. Do không có giám thị, bạn học không giám sát, thoải mái khám phá các patterns ẩn chứa bên trong dữ liệu.
Học có giám sát giải quyết các bài toán về phân loại hoặc hồi quy. Chẳng hạn như kiểm tra email có phải là spam hay không, dự đoán giá nhà 100m2 ở khu đô thị Vạn Phúc City là bao nhiêu khi biết giá của các căn hộ xung quanh. Học không giám sát thì lại gom cụm, liên kết, hoặc giảm chiều. Ví dụ như đề xuất cho người mua 1 vài sản phẩm tiềm năng như ốp lưng khi biết họ mới mua iPhone 16 Promax.
Điều gì làm cho AI trở nên khó nhằn?
A: Dù có nhiều ứng dụng, nhiều người gặp rào cản lớn khi gia nhập ngành AI, một số vấn đề tiêu biểu có thể kể đến:
- Dữ liệu có đủ lớn và đảm bảo hay không?
- Có cách nào để hiểu được ý nghĩa của các tham số bên trong của các mô hình học máy hay không?
- Tài nguyên tính toán (CPU, GPU, Mem) có đủ để lưu trữ và xử lý lượng dữ liệu huấn luyện khổng lồ hay không?
- Các mô hình học máy, học sâu không ngừng được cập nhật và bổ sung. Không ai biết chắc ngày mai sẽ có bao nhiêu mô hình mới được ra đời.
AI có thay thế con người?
A: Câu hỏi khá thú vị và nhiều người hỏi. Câu trả lời của CS Vỉa hè là có… và không. Mà chính xác là không. Với những công việc lặp đi lặp lại thì AI hoàn toàn có thể thay thế con người. Còn đối với bác sĩ, kỹ sư hay luật sư, AI chỉ có thể hỗ trợ chứ không thể thay thế họ. Hơn nữa, bản thân AI còn tạo ra nhiều ngành nghề mới như phân tích dữ liệu, kỹ sư học máy. Chưa kể, AI còn giúp nhiều ngành nghề trở thành xu hướng như nhà sáng tạo nội dung số, digital marketing và bán hàng online.
Tổng kết
Đây là bài viết đầu tiên của danh mục AI vỉa hè. Sắp tới, sẽ có nhiều bài viết hướng dẫn xây dựng các mô hình AI và một số cách tiếp cận AI theo style vỉa hè. Rất mong nhận được sự ủng hộ của các độc giả!
Để lại một bình luận