您现在的位置是:Công nghệ >>正文
Máy móc hiểu con người mà không cần nghe giọng nói
Công nghệ1人已围观
简介Hai nghiên cứu đã chứng minh máy móc có thể hiểu những gì con người nói mà không cần nghe giọng nói ...
Hai nghiên cứu đã chứng minh máy móc có thể hiểu những gì con người nói mà không cần nghe giọng nói của họ.
![]() |
Trí tuệ nhân tạo hơn hẳn con người trong nhận dạng ngôn ngữ từ tín hiệu môi. Ảnh: MIT Technology Review. |
Hiểu từ ngữ từ cách ra hiệu môi là một bài toán khó,áymóchiểuconngườimàkhôngcầnnghegiọngnóđội tuyển bóng đá quốc gia brasil phụ thuộc hoàn cảnh và khả năng thông hiểu ngôn ngữ thông qua tín hiệu thị giác. Tuy nhiên, các nhà nghiên cứu đã chứng minh rằng máy móc có thể nhận dạng ngôn ngữ từ một đoạn video câm tốt hơn cả những người hiểu cách ra hiệu môi chuyên nghiệp.
Nhóm nghiên cứu thuộc ngành Khoa học máy tính của đại học Oxford đã phát triển hệ thống trí tuệ nhân tạo mang tên LipNet. Hệ thống được xây dựng trên cơ sở dữ liệu GRID, tạo nên từ một loạt clip trực tiếp về những người đang đọc các mẫu câu đơn giản.
Nhóm đã sử dụng dữ liệu này để phát triển một hệ thống nơ-ron công nghệ nhận diện ngôn ngữ. Dù hệ thống nhận diện sai lệch từ ngữ nhiều lần, quá trình học nhằm liên kết thông tin đến giải thích những gì đang được nói đã diễn ra, bởi lẽ tín hiệu môi luôn ít hơn số âm thanh mà chúng thể hiện.
Từ đây, máy móc bắt đầu xem xét toàn bộ đoạn video, phát triển khả năng hiểu đoạn văn từ các câu được phân tích.
Khi thử nghiệm, hệ thống có thể nhận diện chính xác đến 93,4%. Trong khi đó, những tình nguyện viên được yêu cầu đọc tín hiệu môi trong bài tập này đoán đúng chỉ 52,3% số từ.
Bên cạnh đó, theo tờ New Scientist, một nhóm khác thuộc ngành Khoa học kĩ thuật của đại học Oxford, làm việc với Google DeepMind, đã nghiên cứu vấn đề với một bài tập khó hơn về ngôn ngữ. Thay vì dùng cơ sở dữ liệu đơn giản và nhất quán như GRID, nhóm này dùng đến 100.000 video ở cấp độ từ ngữ rộng và phát âm phức tạp từ đài BBC.
Với phương pháp tương tự, nhóm từ Oxford và DeepMind đã xây dựng một cỗ máy với khả năng nhận diện đúng 46,8% tất cả từ ngữ. Kết quả này cho thấy chúng hoạt động tốt hơn cả con người với chỉ 12,4% từ đúng.
Gác lại những khác biệt, cả hai thí nghiệm chứng tỏ trí tuệ nhân tạo hơn hẳn con người trong nhận dạng ngôn ngữ từ tín hiệu môi, và không lâu nữa, chúng ta rồi sẽ chứng kiến những ứng dụng đầy tiềm năng cho lĩnh vực này.
Trong tương lai, biết đâu Skype cũng sẽ áp dụng chúng bằng cách ghi lại lời thoại, khi người gọi đang ở một chốn ồn ào, hoặc người nghe gặp khó khăn để giữ smartphone và lắng nghe trọn vẹn đầu dây bên kia?
Theo Zing/New Scientist
Tags:
相关文章
Nhận định, soi kèo Sanfrecce Hiroshima vs Yokohama FC, 12h30 ngày 2/3: Khẳng định sức mạnh
Công nghệHồng Quân - 01/03/2025 15:19 Nhật Bản ...
阅读更多Nhận định, soi kèo Nottingham vs Arsenal, 02h30 ngày 27/2: Khó tin Pháo thủ
Công nghệHư Vân - 26/02/2025 04:35 Ngoại Hạng Anh ...
阅读更多Nhận định, soi kèo Nữ Romania vs Nữ Ba Lan, 22h59 ngày 25/2: Bay cao trên BXH
Công nghệPha lê - 25/02/2025 09:49 Nhận định bóng đá g ...
阅读更多
热门文章
- Nhận định, soi kèo Sabah vs Araz Nakhchivan, 22h30 ngày 4/3: Cửa dưới thất thế
- Nhận định, soi kèo FC Tokyo vs Nagoya Grampus, 17h00 ngày 26/2: Cân bằng
- Nhận định, soi kèo U21 Hull vs U21 Sheffield United, 21h00 ngày 25/2: Tin vào cửa dưới
- Nhận định, soi kèo Negeri Sembilan vs Kedah, 20h00 ngày 26/2: Chìm trong khủng hoảng
- Nhận định, soi kèo Manisa FK vs Igdir FK, 20h00 ngày 4/3: Tin vào Igdir FK
- Nhận định, soi kèo Al
最新文章
-
Nhận định, soi kèo Urawa Red Diamonds vs Kashiwa Reysol, 13h00 ngày 2/3: Buồn cho chủ nhà
-
Kèo vàng bóng đá Chelsea vs Southampton, 03h15 ngày 26/2: Khó tin The Blues
-
Soi kèo góc Barcelona vs Atletico Madrid, 3h30 ngày 26/2
-
Nhận định, soi kèo Antalyaspor vs Besiktas JK, 19h00 ngày 25/2: Tiếp tục chiến thắng
-
Nhận định, soi kèo TPHCM vs Hoàng Anh Gia Lai, 19h15 ngày 2/3: Giải cơn khát chiến thắng
-
Nhận định, soi kèo Deportivo Pasto vs Union Magdalena, 07h30 ngày 26/2