17/12/2022 (11:35:56)
Trong lần thứ năm được tổ chức, Zalo AI Summit 2022 sẽ bàn về những xu hướng ứng dụng AI mới nhất vào trong cuộc sống, các ngành khoa học.
Khán giả theo dõi chia sẻ của ông Sơn về quãng thời gian đưa công trình giải mã trình tự gen đầu tiên của con người lên Internet, gồm những thách thức, khó khăn và kết quả ban đầu.
Ông Sơn cho biết ADN của con người có thể quy đổi ra cuốn sách với 3 tỷ chữ cái. Trong lịch sử, nhiều nhà khoa học đã góp phần xây dựng công trình giải mã trình tự gen, lập ra bản đồ gen của con người. Trong các nghiên cứu về giải trình tự gen, khó khăn chung đến từ khối lượng dữ liệu, cách tổ chức và sắp xếp.
Bên cạnh giáo dục và ngôn ngữ, y tế cũng là lĩnh vực thu hút sự quan tâm của các kỹ sư AI. Tiến sĩ Sơn Phạm, CEO BioTuring là tác giả của nhiều nghiên cứu tin sinh học (bioinformatics), chia sẻ về chủ đề "AI nghiên cứu con người: hướng đến hiểu biết sâu sắc hơn về bệnh tật và phương pháp điều trị".
Ông Sơn cho rằng con người đang tìm cách để khai phá vũ trụ. Tuy nhiên, một vũ trụ khác ở bên cạnh chúng ta có thể được nghiên cứu, chính là sinh học. "Khi dùng kính hiển vi soi vào đầu ngón tay, chúng ta nhìn thấy một tế bào. Sâu hơn trong đó là các lớp tế bào, nhân tế bào. Trong nhân là bộ gen là nhiễm sắc thể", ông Sơn chia sẻ.
Theo ông Điền, những thách thức khi ứng dụng AI trong ngôn ngữ và giáo dục như bộ dữ liệu huấn luyện chưa đa dạng. Thay vì sử dụng công cụ của Google, AI dịch thuật do người Việt xây dựng có thể ứng dụng trong môi trường doanh nghiệp, hỗ trợ các công ty nước ngoài trong dịch thuật, tránh những sai sót gây sai nghĩa do ngắt câu không đúng vị trí.
Ông Điền khẳng định đó là thế mạnh của người Việt trong xây dựng bộ dữ liệu ngôn ngữ để huấn luyện Iuyện AI trong dịch thuật.
Đối với những người nghiên cứu văn học, dịch từ chữ Nôm sang chữ Quốc ngữ là nhu cầu cần thiết. Tuy nhiên, đa số công cụ dịch hiện nay chỉ hỗ trợ dịch Anh - Việt hoặc Hán - Việt. Ông Điền nêu một số lý do cần dịch chữ Nôm sang chữ Quốc ngữ như tìm hiểu lịch sử, đọc tài liệu liên quan đến chủ quyền, và AI là công cụ hỗ trợ hiệu quả.
Bài toán khó khi dùng AI dịch chữ Nôm sang chữ Quốc ngữ là một chữ Nôm có thể có nhiều cách dịch, trong khi những dịch giả có thể có cách dịch khác nhau.
Tiến sĩ Đinh Điền đưa ra vấn đề về các ứng dụng dịch thuật. Hiện tại, những phương tiện hỗ trợ dịch thuật từ tiếng Anh có thể được ứng dụng nhiều trong thực tế. "Liệu việc đào tạo phiên dịch tiếng Anh có còn cần thiết?", ông Điền đặt câu hỏi.
Tiến sĩ cho rằng kho dữ liệu của máy dịch ngày càng được mở rộng nhờ sự đóng góp của cộng đồng.Tuy nhiên tính ồn định của công nghệ vẫn cần được chứng minh, dựa trên ngữ cảnh. Do đó, con người cần sử dụng kiến thức, kỹ năng cho các lĩnh vực yêu cầu cao hơn. Trong khi đó, AI có thể được sử dụng thay thế cho những nhu cầu cơ bản.
Một trong những đặc điểm của tiếng Việt là một từ có thể mang nhiều nghĩa. Các kỹ sư có thể xây dựng kho dữ liệu gồm các câu chứa những từ trên, sau đó "huấn luyện" AI để đưa ra từ ngữ phù hợp để dùng trong câu tiếng Việt, giúp người nước ngoài sử dụng đúng cách tùy ngữ cảnh.
"Dựa trên dữ liệu của câu nói, máy học có thể đưa ra ví dụ về trường hợp sử dụng thực tế của một từ. Nhờ đó, người dùng có thể học hiệu quả hơn", ông Điền nói.
Sau khi nhận diện ngữ pháp, AI tiếp tục được huấn luyện để dạy văn phạm, gồm các câu dài và phức tạp theo từng cấp độ. Theo ông Điền, để nhận diện độ khó của câu, AI được huấn luyện để nhận biết tần suất sử dụng của các từ, cấu trúc câu (câu đơn, câu phức) và sự liên kết ý nghĩa giữa các câu.
Ông Điền cho rằng độ khó của một từ được tính toán bằng cách đo độ thông dụng của từ. Được sử dụng trong thực tế càng ít, độ khó của từ càng cao. Hệ thống nhận diện độ khó văn phạm của AI có thể ứng dụng trong việc tuyển phóng viên, viết tài liệu, chỉnh sửa sách, biên soạn từ điển hoặc sách giáo khoa, với độ khó phù hợp theo từng độ tuổi.
"Con người không thể biết chắc một từ dễ hay khó. Bảng xếp hạng dựa trên máy học, AI giúp xác định tần suất sử dụng của từ chính xác hơn", Tiến sĩ Đinh Điền nói.
Để xây dựng mô hình AI dạy tiếng Việt, các kỹ sư cần lập danh sách từ được sử dụng nhiều, sau đó "huấn luyện" AI cách tiếp nhận đầy đủ một từ hoặc cụm từ hoàn chỉnh, không bị ngắt quãng. Ngoài ra, AI cũng cần phân biệt loại từ (danh từ, động từ, tính từ...) để sử dụng đúng ngữ cảnh.
"Làm sao để AI biết đâu là một từ, đâu là tiếng, thành tố trong một từ. Các yêu cầu này buộc phải dùng đến máy học, AI", Tiến sĩ Đinh Điền chia sẻ quan điểm. Theo ông Điền, khi nắm được 10% số từ thông dụng, người học đã có thể đọc 90% số văn bản được viết bằng một loại ngôn ngữ.
PGS.TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học Tính toán, Trường ĐH Khoa học Tự nhiên (ĐHQG TP.HCM) chia sẻ về đề tài "Ứng dụng AI trong Ngôn ngữ học và Giáo dục".
Theo thống kê, tiếng Việt là một trong 20 ngôn ngữ được sử dụng nhiều nhất thế giới. Đối với tiếng Việt, bên cạnh ngữ âm còn có thanh điệu nên sẽ khó học với những người dùng ngôn ngữ mẹ đẻ không có thanh điệu. Điều đó đặt ra bài toán dạy tiếng Việt hiệu quả cho người nước ngoài trong mọi thời điểm. Đó là lúc xây dựng mô hình AI hiệu quả.
Các ứng dụng của AI có thể được sử dụng để nghe và nhận diện cách người nói phát âm, tìm lỗi sai.
Tối ưu để sử dụng trong thực tế là mục tiêu chính của eKYC. Dù vậy theo ông Đức, vẫn còn "chặng đường dài" để tạo ra sản phẩm tốt hơn theo từng ngày. "Sự hoàn hảo trên AI có thể không có thật trong thực tế. Đội ngũ muốn gửi gắm mục tiêu phát hiện ra lỗi và hoàn thiện sản phẩm mỗi ngày", ông Đức nói thêm.
Bên cạnh lỗi ảnh kém chất lượng, một số trường hợp tấn công (chụp ảnh màn hình, chân dung từ ảnh in hoặc hình nộm), người dùng bị tai nạn biến dạng mặt hoặc phẫu thuật thẩm mỹ. Từ các trường hợp trên, đội ngũ Zalo AI Lab đã xây dựng các giải pháp xử lý để sử dụng trong thực tế.
Cuối cùng, trong những trường hợp khó, vẫn phải dùng tới biện pháp xác thực thủ công bằng con người. Ông Đức cho rằng AI không được tạo ra để thay thế hoàn toàn con người.
Ông Châu Thành Đức, Giám đốc Khoa học Dữ liệu Zalo AI, chịu trách nhiệm phát triển các sản phẩm “AI-first” (ưu tiên cho AI) chia sẻ về quá trình xây dựng giải pháp xác thực danh tính eKYC. Theo ông Đức, hiện có 5 ngân hàng và tỗ chức tài chính sử dụng eKYC, với 30.000 lượt xác thực danh tính mỗi ngày. Hệ thống của Zalo sử dụng ảnh chân dung đối chiếu với căn cước công dân để xác minh danh tính người dùng.
Một số khó khăn khi đối chiếu dữ liệu bao gồm ảnh bị mờ, chói sáng tại khu vực quan trọng hoặc căn cước không hợp lệ. Điều đó khiến quá trình xác thực không thành công.
"Một mô hình eKYC muốn đi vào sử dụng thực tế phải giải quyết được toàn bộ những vấn đề này", ông Đức nói.
Trong mô hình ASR, đội ngũ Kiki còn tích hợp module nhận diện giọng nói (Voice Activity Detection - VAD), kết hợp phân tích bối cảnh để nhận biết thời điểm hoàn thành nhận lệnh. GIải pháp này giúp giảm 40% lần nhận diện sai, và giảm 30% thời gian chờ dừng lệnh.
Đối với những dòng lệnh có quãng nghỉ giữa câu dài (do thói quen người dùng), trợ lý giọng nói có thể dừng nhận lệnh dù chưa hết câu. "Trong thử nghiệm, mạng ổn định AI có thể hoạt động liền mạch. Tuy nhiên ra thực tế, sản phẩm sẽ đối mặt với nhiều vấn đề phức tạp khác", ông Duy chia sẻ về những khó khăn trong quá trình xây dựng Kiki tại Zalo.
Đội ngũ dự án cho biết sẽ liên tục làm việc, cập nhật để giải quyết vấn đề người dùng có trải nghiệm tốt nhất cùng trợ lý giọng nói. "Xây dựng Kiki là hành trình cố gắng, chăm chút từ những điều nhỏ nhất để tạo ra sự khác biệt, mang đến trải nghiệm tốt nhất cho người dùng", ông Duy nói.
Ông Nguyễn Hoàng Khánh Duy, Quản lý Sản phẩm Kiki, chia sẻ về chủ đề "Chặng cuối để đưa AI vào đời thực". Ông cho biết Kiki hiện có hơn 1 triệu người dùng, trong đó lượng người dùng cài đặt Kiki trên xe hơi đạt mốc 200.000 người.
Khi chuyển đổi từ Zing MP3 sang mô hình sử dụng trên xe hơi, đội ngũ tại Zalo gặp khó khăn trong việc nhận diện tên địa điểm từ giọng nói. Với mô hình ASR cùng dữ liệu của 350.000 địa điểm, Kiki có thể "hiểu" địa điểm của người dùng tốt hơn, đồng thời phân biệt tên địa điểm với lời bài hát.
Ông Duy đưa ra các trường hợp sử dụng thực tế, khi nhiều thông tin nhập vào từ người dùng bao gồm cả tiếng Việt và nhiều ngôn ngữ khác. Do đó, Kiki cần đủ thông minh để phân biệt các trường hợp để ghi nhận nội dung được chia sẻ.
Đối với Zalo AI Challenge, sự kiện được tổ chức thường niên nhằm cổ vũ nghiên cứu, phát triển AI tại Việt Nam. "Bộ đề của Zalo được lựa chọn phù hợp với thực tiễn xã hội, cùng với bộ dữ liệu dành cho các đội thi giúp triển khai hiệu quả các giải pháp", ông Tú chia sẻ.
Với các mô hình được chia sẻ, ông Tú cho biết AI sẽ ngày càng dễ tiếp cận, có thể giảng dạy online hoặc tại các trường đại học.
Zalo AI Challenge năm nay có sự tham gia của một số cố vấn giúp ra đề thi chất lượng hơn. Ngoài ra, cách tính điểm performance cũng có sự thay đổi nhằm quyết định người chiến thắng. Theo ông Tú, có khoảng 1.500 đội tham gia Zalo AI Challenge năm nay, cao hơn so với các năm trước.
Đúng 9h10, ông Tú Nguyễn, Giám đốc Công nghệ Zalo công bố khai mạc sự kiện. Ông Tú chia sẻ hiện AI đã được ứng dụng vào nhiều lĩnh vực như y tế, tài chính, nông nghiệp... giúp tăng năng suất, giảm chi phí và tăng cường chất lượng đời sống. "Đây là sự kiện được Zalo quan tâm đầu tư. Trong đó, AI Summit là nơi chia sẻ giá trị, ứng dụng của AI trong đời sống và kể cả tại Zalo", ông Tú cho biết.
Ngay tại Zalo, AI cũng được ứng dụng trong nhiều lĩnh vực như nhận diện khuôn mặt, bên cạnh trợ lý giọng nói Kiki dùng cho xe hơi. Hiện tại, hơn 200.000 ôtô tại Việt Nam đã được cài công cụ này.
Trước giờ sự kiện bắt đầu, hàng trăm bạn trẻ đã có mặt tại VNG Campus để thực hiện thủ tục check-in. Việc xác minh thông tin được thực hiện nhanh chóng thông qua việc quét mã QR bằng ứng dụng Zalo trên di động.
Tiến sĩ Sơn Phạm, CEO BioTuring là tác giả của nhiều nghiên cứu tin sinh học (bioinformatics). Cùng với những chuyên gia khác, ông tham gia giảng dạy khóa học đầu tiên về tin sinh học trên Coursera với hơn 20.000 học viên.
PGS.TS Đinh Điền hiện là Giám đốc Trung tâm Điện toán Ngôn ngữ, Trường ĐH Khoa học Tự nhiên (ĐHQG TP.HCM). Ông có nhiều đề tài nghiên cứu và bài báo khoa học trên tạp chí quốc tế, xoay quanh việc áp dụng AI trong dịch máy, ngôn ngữ học đối chiếu và dạy tiếng Việt cho người nước ngoài.
Hội thảo còn có sự tham gia của các đại diện đến từ Zalo AI như ông Châu Thành Đức, Giám đốc Khoa học Dữ liệu Zalo AI, chịu trách nhiệm phát triển các sản phẩm “AI-first” (ưu tiên cho AI).
Câu chuyện về sự ra đời của trợ lý giọng nói Kiki được chia sẻ bởi ông Nguyễn Hoàng Khánh Duy, một trong những người phát triển trợ lý giọng nói tiếng Việt từ các dòng mã đầu tiên. Từ khi ra mắt vào tháng 12/2020, Kiki được tích hợp trên hơn 18 hãng màn hình ôtô thông minh, đạt mốc 200.000 lượt cài đặt.
Bên cạnh chia sẻ từ chuyên gia, các giải pháp thực tiễn nhằm ứng dụng AI trong xã hội sẽ được trình bày bởi các kỹ sư xuất sắc của Zalo AI Challenge - cuộc thi nhằm khuyến khích và cổ vũ nghiên cứu AI tại Việt Nam.
Được tổ chức lần đầu vào năm 2017, Zalo AI Summit là sự kiện quy tụ các chuyên gia uy tín trong lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam và trên thế giới.
Trong lần thứ 5 được tổ chức, Zalo AI Summit mang chủ đề "AI đã thay đổi cuộc sống người Việt như thế nào?". Những khách mời tại sự kiện sẽ mang đến các giải pháp ứng dụng AI vào các lĩnh vực trong cuộc sống.
Đề tài thu hút sự quan tâm của cộng đồng yêu công nghệ bởi trong 2 năm qua, ngành AI tại Việt Nam có bước tiến nhất định để đáp ứng các xu hướng mới, hình thành trong bối cảnh nhu cầu ứng dụng công nghệ tăng cao do đại dịch.
Xuân Sang - Phúc Thịnh
Ảnh: Duy Anh
Theo: ZINGNEWS.VN |