您现在的位置是:NEWS > Nhận định
Trí tuệ nhân tạo bước vào thế giới ngôn ngữ tiếng Việt
NEWS2025-02-06 12:53:56【Nhận định】3人已围观
简介Không chỉ giúp con người học ngôn ngữ, trí tuệ nhân tạo còn giúp các hệ thống hỗ trợ lý trí thông mithứ hạng của al-nassrthứ hạng của al-nassr、、
Kết hợp AI “dạy” tiếng Việt
Lãnh đạo của một doanh nghiệp có vốn đầu tư trực tiếp nước ngoài (FDI) tại Việt Nam mong muốn học tiếng Việt nhanh, đọc được 90% nội dung của các văn bản thông thường. Vấn đề là, ông ấy quá bận rộn và chỉ có khoảng thời gian 1 tiếng (từ 12-13h mỗi ngày) để học. Vì vậy, cần áp dụng công nghệ vào phần mềm học ngôn ngữ sao để giúp ông ngoại ngữ nhanh?
Trên đây là bài toán của vị trí lãnh đạo công ty FDI đặt ra với PGS.TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học tính toán, Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP.HCM.
Là người có nhiều đề tài nghiên cứu khoa học và công trình công bố quốc tế về ứng dụng trí tuệ nhân tạo (AI) trong dịch máy, ngôn ngữ học phản bác và dạy tiếng Việt cho người nước ngoài, PGS Điền cho rằng, ứng dụng AI rất cần thiết để giải quyết các vấn đề trong ngôn ngữ học.
Cụ thể, bước đầu tiên của việc học bất kỳ ngôn ngữ nào là dạy ngôn ngữ âm thanh. Rào cản ở đây là tiếng Việt có thanh điệu, có điệu, khi dạy cho những người học thuộc hệ ngôn ngữ không có thanh điệu như người Anh, người Pháp… sẽ rất khó. Đơn cử, thay vì hỏi: “Bạn đi ngủ chưa?” thì người học sẽ nói “Bạn đi ngu chưa?”, bởi họ không phân biệt được thanh điệu. Cần dạy họ đặt trò chơi ở đâu khi phát âm, khẩu hình ngậm ra sao, phát âm ra đúng hay sai khác nhau như thế nào.
Lúc này, phần mềm ứng dụng AI trong dạy ngoại ngữ có thể mô phỏng khẩu hình đánh răng, phát âm thanh sẵn để người học bắt chước. Sau đó, người học tập phát lại âm thanh, thu vào phần mềm, sử dụng công nghệ đối chiếu giữa phát âm của người học và phát âm chuẩn từ phần mềm, cải thiện khả năng phát âm nhanh. Tất cả các công đoạn trên đều bắt buộc phải ứng dụng AI.
Một dẫn chứng khác, theo Từ điển tiếng Việt của Viện Ngôn ngữ học do cố Giáo sư Hoàng Phê chủ biên, vốn từ gốc tiếng Việt có khoảng 34.000 từ, tính toán cho thấy, cần dạy khoảng 10% lượng từ cho máy, tương đương với 3.400 từ thông tin ứng dụng, là máy có thể đọc được khoảng 90% văn bản tiếng Việt thông thường. Để có được bảng thống kê dữ liệu này, PGS Điền buộc phải sử dụng AI, gắn nhãn lên hệ thống từ vựng trong kho ngữ liệu tiếng Việt .
Có thể nói, AI đã thay đổi cách dạy - học của ngành giáo dục. Thực tế, rất nhiều ứng dụng trí tuệ nhân tạo đã ra đời nhằm hỗ trợ quá trình dạy - học trở nên nhanh chóng, hiệu quả hơn.
Câu chuyện kết hợp giữa khoa học máy tính và ngôn ngữ học khá thú vị trên cho thấy, quá trình đào tạo, ứng dụng AI vào thực tế là rất cần thiết, song không dễ dàng. Các dữ liệu cần được phân tách theo nhiều lớp định danh, ở mỗi lớp sẽ phải xử lý từng biến số với các định danh cụ thể khác nhau nữa.
Khi máy móc học ngôn ngữ...
Không chỉ giúp con người học ngôn ngữ, trí tuệ nhân tạo còn giúp các hệ thống hỗ trợ lý trí thông minh ngôn ngữ tốt hơn. Máy móc được huấn luyện và tiến bộ mỗi ngày.
Tương tự câu chuyện của PGS Điền, dưới đây lại là dẫn chứng sinh động khác về cách mà một trợ lý thông minh hiểu ngôn ngữ con người.
Đó là quá trình nghiên cứu và phát triển trợ lý giọng nói tiếng Việt Kiki trên ô tô, để nhận dạng tốt giọng nói với nhiều ngữ điệu vùng miền khác nhau. Trong khoa học máy tính, nhận dạng giọng nói là một nhánh quan trọng của trí tuệ nhân tạo (AI), chuyển đổi giọng nói con người thành một định dạng hữu ích và có thể hiểu được bằng các ứng dụng máy tính. Công nghệ này là cầu nối tương tác giữa máy móc và con người. Trợ lý giọng nói đã trở thành ứng dụng không thể thiếu trên toàn thế giới. Phổ biến nhất có thể kể đến như: Siri của Apple, Google Assistant, Amazon Alexa, hay Kiki ở Việt Nam.
Anh Nguyễn Hoàng Khánh Duy, người viết những dòng code đầu tiên cho Kiki chia sẻ, để huấn luyện mô hình AI đủ thông minh khi nhận diện giọng nói, phản hồi thông tin đúng cho người dùng, thì dữ liệu ngôn ngữ đóng vai trò chủ chốt.
Dẫn chứng, chức năng rất quan trọng với người dùng trợ lý tiếng Việt Kiki trên ôtô là dẫn đường. Do đó, đội ngũ phát triển sản phẩm phải chuẩn bị dữ liệu, vốn từ vựng để hỗ trợ “mượt” cho các câu lệnh từ người dùng. Sau quá trình thu thập dữ liệu, huấn luyện mô hình, chỉ số thể hiện chất lượng nhận diện giọng nói ở phiên bản sau đã cải thiện 40% so với ban đầu.
Việc nhận diện giọng nói trên xe ô tô không chỉ dừng lại ở mỗi bài toán về dẫn đường, địa điểm mà còn nhiều vấn đề khác.
Ví dụ, đặc thù sử dụng Kiki trên xe ô tô thì tiếng ồn do động cơ, gió hay tiếng phát ra từ các thiết bị giao thông trên đường cũng rất lớn, điều này ảnh hưởng trực tiếp tới chất lượng nhận diện giọng nói của Kiki trên xe. Do đó, yêu cầu đội ngũ Kiki phải cố gắng giải quyết điều kiện ồn ào bằng cách tăng cường dữ liệu bằng cách nói trong điều kiện ồn ào sao cho phù hợp với cuộc sống thực tế nhất.
Ngoài ra, bằng các kỹ thuật mới trên thế giới như self-supervised (học tự giám sát), Kiki đang cố gắng “học” từ cả những dữ liệu không được gán nhãn, để cải thiện mô hình tốt hơn nữa. Tính ổn định của trợ lý giọng nói tiếng Việt này đang cải thiện với việc không ngừng đào tạo, nâng cấp sản phẩm.
Rõ ràng, tiến bộ của công nghệ đang diễn ra hàng ngày, hàng giờ. ChatGPT ra đời cuối năm 2022 đã trả lời một phần cho câu hỏi về cách dữ liệu lớn vận hành. Công nghệ đang “bước” vào giữa đời sống, đặc biệt, trong giáo dục, ngôn ngữ, những lĩnh vực vốn phụ thuộc nhiều vào con người trước đây. AI tái định nghĩa cách chúng ta học tập, làm việc, sinh hoạt... như những ví dụ cụ thể nêu trên.
Mạnh Hưng và nhóm PV, BTV很赞哦!(537)
相关文章
- Nhận định, soi kèo AC Milan vs Inter Milan, 0h00 ngày 3/2: Derby màu xanh
- PUBG: Các mẫu skins mang phong cách shroud, chocoTaco đã có trong game
- Những nguyên tắc 'vàng' khi sử dụng điều hòa trên ô tô
- 3 lần phẫu thuật tìm cây kim gãy trong mắt bé trai 4 tuổi
- Nhận định, soi kèo Girona vs Las Palmas, 3h00 ngày 4/2: Ngựa ô hết thời
- Truyện Y Tiên Thiểu
- Ô tô phóng nhanh lao vào đại lý lốp xe đâm vào tám phương tiện đang đậu
- Bộ Y tế ‘mạnh tay’ phòng chống dịch MERS
- Nhận định, soi kèo Asteras Tripolis vs Lamia, 23h00 ngày 3/2: Cửa dưới thất thế
- Bất ngờ với top ô tô bán chạy nhất Việt Nam
热门文章
站长推荐
Nhận định, soi kèo Odisha vs NorthEast United, 21h00 ngày 3/2: Đối thủ yêu thích
- Google Station là dự án mang Internet đến với mọi người thông qua các điểm phát Wi-Fi miễn phí được đặt tại các nơi công cộng. Hiện Google Station đã có mặt tại một số quốc gia như Thái Lan, Ấn Độ, Mexico, Indonesia, Philippines và Nigeria.
Mặc dù chưa có mặt trong danh sách hỗ trợ chính thức, tuy nhiên có vẻ như Google đã bắt đầu thử nghiệm dịch vụ này tại Việt Nam. Mới đây, đã có thông tin cho biết Wi-Fi miễn phí của Google xuất hiện trong khuôn viên một số trường đại học như Đại học Điện lực (Hà Nội), Đại học Bách khoa (Đà Nẵng), Đại học Sư phạm Kỹ thuật (TP.HCM), Học viện Công nghệ Bưu chính Viễn thông (TP.HCM)...
Chúng tôi đã có dịp được sử dụng dịch vụ "Wi-Fi chùa" của Google tại Đại học Điện lực (Hà Nội) và sau đây là một số trải nghiệm thực tế:
Qua tìm hiểu kỹ hơn, có vẻ như Google đang hợp tác cùng Swifi để mang Google Station đến Việt Nam. Swifi trực thuộc Công ty Cổ phần Dịch vụ Bưu chính Viễn thông Sài Gòn (Sài Gòn Postel - SPT), chuyên cung cấp các giải pháp Wi-Fi công cộng miễn phí.
Trong quá trình triển khai Google Station, do Google nhận nhiệm vụ cung cấp giải pháp phần mềm và đưa ra gợi ý về phần cứng, vậy nên vai trò của Swifi trong việc cung cấp phần cứng và đường truyền là rất quan trọng. Đó cũng là lý do tại sao chúng ta thấy mạng Wi-Fi có tên "FreeGoogleStation - Swifi", cũng như sự xuất hiện của logo Swifi xuyên suốt quá trình kết nối.
Hiện nay, Google vẫn chưa đưa ra thông báo chính thức về việc triển khai Google Station tại Việt Nam.
Theo GenK
">Trải nghiệm dịch vụ Wi
Quảng Ninh: Người dân ngồi nhà vẫn có thể lấy số giải quyết thủ tục hành chính
- Quá nhiều thủ đoạn, nạn đinh tặc ngày một nguy hiểm với sự xuất hiện của những chiếc đinh 4 chân, 5 chân và giờ là bàn chông tự chế dễ dàng xé nát lốp xe của bất cứ chiếc ô tô nào trên đường khi không may cán phải.'Đinh tặc' ở Sơn La rải xốp gắn đinh nhọn, bẫy ôtô cực nguy hiểm">
Rợn người bàn chông tự chế của đinh tặc ở Tuyên Quang
Nhận định, soi kèo Chelsea vs West Ham, 3h00 ngày 4/2: Derby của Chelsea
Ảnh minh họa Tuy nhiên, số lượng người bệnh được chữa trị còn rất thấp, cứ 10 người thì chỉ có 2-3 người được điều trị, trong đó điều trị bằng thuốc vẫn là chủ yếu, điều trị tâm lý rất hạn chế.
Theo các chuyên gia, do nhận thức hạn chế, người dân vẫn chưa hiểu đúng về sức khỏe tâm thần, đánh đồng tất cả đều là “điên” mà không biết có nhiều rối loạn tâm thần khác như trầm cảm, mất ngủ, lo âu… dẫn đến tình trạng kì thị, phân biệt đối xử. Công tác phát hiện và điều trị người mắc các bệnh về tâm thần đang có một khoảng trống lớn, có đến 70%-80% người mắc bệnh chưa được phát hiện bệnh để điều trị.
Bên cạnh đó, số lượng bác sĩ chuyên khoa tâm thần còn ít. Cả nước có 850 bác sĩ nhưng chỉ tập trung tại tuyến trung ương và các thành phố lớn.
Tăng cường chăm sóc và bảo vệ sức khỏe tâm thần
Hiện tại, Việt Nam là một trong 35 nước chưa có luật về sức khỏe tâm thần. Trước nhu cầu ngày càng cao về chăm sóc sức tâm thần của nhân dân, nhằm giảm bớt gánh nặng do rối loạn tâm thần gây ra, hoàn thiện hành lang chính sách và luật pháp, tăng cường việc chỉ đạo điều hành trong công tác chăm sóc sức khỏe, Bộ Y tế xây dựng dự thảo Chiến lược quốc gia về sức khỏe tâm thần giai đoạn 2016-2025, tầm nhìn đến 2035 để trình Thủ tướng Chính phủ phê duyệt.
Dự thảo Chiến lược với quan điểm sức khỏe là vốn quý nhất của mỗi con người và của toàn xã hội. Không có sức khỏe tâm thần thì sẽ không có sức khỏe. Sức khỏe tâm thần góp phần đạt được mục tiêu phát triển bền vững.
Kế hoạch tập trung vào 4 mục tiêu chính là tăng cường lãnh đạo và điều hành hiệu quả cho sức khỏe tâm thần; Cung cấp các dịch vụ chăm sóc về y tế và xã hội dựa vào cộng đồng toàn diện, lồng ghép và đáp ứng nhu cầu; Triển khai các chiến lược nhằm nâng cao sức khỏe tâm thần và dự phòng rối loạn tâm thần; và củng cố hệ thống thông tin, bằng chứng và nghiên cứu cho sức khỏe tâm thần.
Việc triển khai Kế hoạch Hành động sẽ cho phép người có rối loạn tâm thần tiếp cận dễ dàng hơn các dịch vụ sức khỏe tâm thần và chăm sóc xã hội; Người mắc các rối loạn tâm thần được điều trị bởi các nhân viên y tế có kỹ năng phù hợp trong các cơ sở chăm sóc sức khỏe đa khoa, chương trình hành động giảm khoảng trống về sức khoẻ tâm thần mhGAP của WHO và các công cụ dựa trên bằng chứng tạo thuận lợi cho quá trình này; tham gia tổ chức lại, cung cấp và đánh giá dịch vụ nhằm đảm bảo dịch vụ chăm sóc và điều trị đáp ứng tốt hơn nhu cầu của họ; tiếp cận nhiều hơn tới các chính sách về khuyết tật, chương trình nhà ở và sinh kế của chính phủ, và tham gia tốt hơn trong công việc, đời sống cộng đồng và các vấn đề dân sự.
Theo đó, phấn đấu đến năm 2025 tăng tỷ lệ người trưởng thành hiểu biết về sức khỏe tâm thần đạt 70%; tỷ lệ người có rối loạn tâm thần nhận thức được quyền của người có rối loạn tâm thần đạt 50%; giảm 20% tỷ lệ tự tử đến năm 2025. Số lượt người có rối loạn tâm thần được điều trị tại các cơ sở chuyên khoa tâm thần tăng thêm 50% đến năm 2025…
Đến năm 2035, sức khỏe tâm thần được tăng cường và bảo vệ, các rối loạn tâm thần được phòng ngừa hiệu quả và người có rối loạn tâm thần được bảo đảm đầy đủ quyền con người theo quy định của pháp luật, được tiếp cận các dịch vụ chăm sóc y tế và xã hội có chất lượng, kịp thời, và phù hợp về mặt văn hóa nhằm đạt được sức khỏe và sức khỏe tâm thần tốt nhất có thể, tăng cường sự phục hồi và tham gia đầy đủ vào hoạt động xã hội ở đó không có sự kỳ thị và phân biệt đối xử.
M.M
">80% người Việt không điều trị rối loạn tâm thần
- - Gia nhập MU theo dạng chuyển nhượng tự do, Zlatan Ibrahimovic nhanh chóng chứng tỏ là cây săn bàn số 1 của Quỷ đỏ với 27 bàn thắng. Bên cạnh đó, chân sút người Thụy Điển còn có nhiều pha xử lý khéo léo và không ít lần khiến đối thủ khóc thét.Video những bàn thắng của Ibrahimovic cho MU">
MU: Những pha xử lý khéo léo của Ibrahimovic trong màu áo MU
Nhà mạng di động Anh đề nghị chính phủ cấp thêm phổ tần 5G do Covid-19 Phổ tần số được đem ra đấu giá lần này sẽ cho phép các nhà khai thác di động cải thiện cả phạm vi phủ sóng và dung lượng của các dịch vụ 5G mới. Dự kiến, cuộc đấu giá sẽ thu về cho chính phủ hơn 1 tỷ bảng Anh (1,23 tỷ USD).
Trước đó, các cơ quan quản lý ở Pháp, Tây Ban Nha, Áo và Bồ Đào Nha cũng đã ra thông báo hoãn đấu giá phổ tần dành cho mạng 5G do đại dịch Covid-19 bùng phát.
Tháng trước, Cơ quan quản lý viễn thông Anh (Ofcom) đã hoàn thiện các quy tắc cho việc bán đấu giá phổ tần ở các băng tần 700 MHz và băng tần từ 3,6 GHz đến 3,8 GHz, với mục đích thúc đẩy triển khai công nghệ 5G trên toàn quốc.
Ofcom cho biết trong một bản phát hành rằng, họ có kế hoạch phát hành một lượng phổ tần 80 MHz trong băng tần 700 MHz, sau khi hoàn thành chương trình kéo dài 4 năm để giải phóng băng tần sử dụng hiện tại cho truyền hình số mặt đất và micro không dây. Bên cạnh đó, họ cũng phát hành lượng phổ tần 120 MHz trong băng tần 3,6 GHz – 3,8 GHz.
Ofcom lưu ý rằng, phổ tần trong băng tần 700 MHz là lý tưởng để cung cấp vùng phủ sóng di động chất lượng tốt cho cả trong nhà và cho một khu vực rộng lớn.
Ofcom cũng cho biết với lượng phổ tần bổ sung lần này sẽ tăng tổng lượng phổ tần có sẵn cho các dịch vụ di động ở Anh thêm 18%.
Cuộc đấu giá sẽ diễn ra trong 2 giai đoạn: Giai đoạn đầu tiên là giai đoạn quan trọng, ở giai đoạn này các công ty viễn thông sẽ đấu thầu một số khối phổ tần riêng biệt nhằm xác định lượng phổ tần mà họ nhận được.
Khi đã xác định được mỗi công ty đã giành được bao nhiêu khối phổ tần, cuộc đấu giá chuyển sang giai đoạn thứ hai, được gọi là giai đoạn ấn định. Ở đây, các công ty trúng thầu trong giai đoạn đầu sẽ đấu thầu lại nhưng lần này để xác định phổ tần số cụ thể mà họ sẽ được phân bổ.
Ofcom tuyên bố họ đang tìm cách duy trì sự cạnh tranh mạnh mẽ trên thị trường bằng cách áp mức trần 37% trên phổ tần có sẵn cho bất kỳ một công ty nào. Giới hạn 37% đối với việc nắm giữ phổ tần tổng thể có tác dụng hạn chế các công ty di động hiện tại chiếm một lượng phổ tần quá lớn.
Với quy định đưa ra như trên thì mỗi nhà mạng như BT và EE sẽ có thể giành được 120 MHz, trong khi nhà mạng Three và Vodafone sẽ có thể giành được tương ứng là 185 MHz và 190 MHz. Còn nhà mạng O2 sẽ không bị giới hạn bởi quy định đưa ra do việc nắm giữ phổ hiện tại của nó ít hơn nhiều so với các nhà mạng khác.
Năm ngoái, các công ty viễn thông Anh đã giành được phổ tần trong băng tần 3,4 GHz (3,4 -3,6 GHz) cho việc cung cấp dịch vụ 5G trong tương lai. Trong đó, Vodafone đã giành được 50 MHz sau khi trả 378 triệu bảng Anh; EE đã giành được 40 MHz với số tiền bỏ ra là 303 triệu bảng Anh. Three giành được 20 MHz với chi phí 151,3 triệu bảng Anh, trong khi O2 thuộc sở hữu của Telefónica đã thu được 40 MHz với giá 318 triệu bảng Anh.
Phan Văn Hòa (theo Rcrwireless)
">Nhà mạng di động Anh thúc giục chính phủ cấp thêm phổ tần 5G do Covid