ThoiTrangABC

Tin hay, mới, giật gân: thời trang, giải trí, thể thao, sức khoẻ, kinh doanh, pháp luật, công nghệ
bởi Trần Trung Thành ngày 10/09/2016 tại 03:17 PM

Trí Tuệ Nhân Tạo Đột Phá Khả Năng Giả Lập Thanh Âm

Trí Tuệ Nhân Tạo Âm Thanh

Trí Tuệ Nhân Tạo (Google DeepMind) đã đạt được một mốc quan khi cải thiện khả năng giả lập giọng nói người và nhạc cụ.  Điều này giúp ích rất nhiều trong cho các nhà chính trị gia với các bài diễn thuyết, các nhà sản xuất âm nhạc và gia tăng khả năng tương tác giao tiếp hội thoại giữa người với nhau.

Trí Tuệ Nhân Tạo Thanh Âm Wave Net

Công nghệ này tên là WaveNet, bước đột phá đã giúp phát triển công nghệ giả lập các tính năng đặc biệt của con người. WaveNet mã hóa các hình thức sóng âm thanh thô để tạo ra tiếng nói giả người. Tương lai, điều này có thể đánh bại các hệ thống chỉ đơn giản làm nhiệm vụ Text-to-Speech.

“Theo các nhà nghiên cứu về Trí Tuệ Nhân Tạo ở Anh thì công nghệ này khiến cho các đoạn hội thọai thực của con người giảm tới 50 phần trăm.”

Xem thêm: Dữ Liệu Trực Tuyến Microsoft Anh Sử Dụng Điện Toán Đám Mây

Trí Tuệ Nhân Tạo Có Khả Năng Diễn Đạt Đầy Sống Động

Điều thú vị về công nghệ WaveNet mang lại là khả năng học tập và diễn đạt các giọng nói phức tạp khác nhau và tạo ra các mẫu biểu cảm rất thực. Các mô phỏng như cử động miệng, nhịp hơi thở, cảm xúc, biến tố ngôn ngữ và dấu sẽ trở nên hoàn toàn khả thi khi Trí Tuệ Nhân Tạo ngày càng phát triển.

“WaveNet có thể nắm bắt được các đặc điểm khác nhau của nhiều diễn giả với độ chính xác gần như tuyệt đối. Và còn có thể chuyển đổi nhịp điệu và cảm xúc cho phù hợp.”-  các nhà nghiên cứu đã viết trong một bài báo cáo.

Trí Tuệ Nhân Tạo Âm Thanh

Trí Tuệ Nhân Tạo Âm Thanh

WaveNet hiện khả năng sử dụng tiếng Anh và tiếng Trung Quốc. Và Trí Tuệ Nhân Tạo cũng có thể sản xuất âm nhạc như piano cổ điển và sáng tác ca khúc riêng của mình.

Công Nghệ Trí Tuệ Nhân Tạo Giúp Wava Net Hoạt Động

Trí Tuệ Nhân Tạo Âm Thanh

Bảng so sánh về khả năng giả lập âm thanh của Wavenet

Tầm quan trọng của Trí Tuệ Nhân Tạo gần đây tạo nên nhiều bước đột phá cho Google trong việc phát triển các ứng dụng công nghệ xung quanh. Để đưa điều này vào bối cảnh. Google đang sử dụng Trí Tuệ Nhân Tạo để giải quyết các thách thức trong việc giả lập giọng nói người. Phương pháp này được gọi là mô hình âm thanh thô dựa trên các công nghệ trước đây là PixelRNN và PixelCNN hoặc Pixelnets xoay chiều. Hệ thống mới này, được mô tả như một chiều WaveNet, đòi hỏi phải có ít nhất 16.000 bit điện tử khác nhau của mẫu mỗi giây. Điều này đòi hỏi việc sử dụng sức mạnh tính toán lớn, người sáng tạo WaveNet cho biết trong một bài đăng blog. Hệ thống cần phải được đào tạo để tạo ra những phát biểu và khả năng diễn đạt không trùng lắp trong những bối cảnh khác biệt của những người khác nhau. Tổng cộng, các thuật toán cơ bản WaveNet yêu cầu tối thiểu 44 giờ của nhiều mẫu âm thanh khác nhau được ghi lại bởi hơn một trăm loa phát cùng lúc.

Xem thêm: Hình xăm công nghệ – xu hướng thời trang của tương lai

Trí Tuệ Nhân Tạo Về Thanh Âm Chưa Có Nhiều Tính Kinh Tế

Tại thời điểm này, các nhà quan sát không thấy bất kỳ tiện ích thương mại nào ngay lập tức cho WaveNet bởi Trí Tuệ Nhân Tạo.Có lẽ, thuật toán DeepMind có thể giảm mức tiêu thụ năng lượng cần thiết cho công việc giúp cải thiện năng suất, như báo cáo trước bởi Tech Times.

Trí Tuệ Nhân Tạo Âm Thanh

Trí Tuệ Nhân Tạo Âm Thanh

Tuy nhiên, khi mọi người đang ngày càng trở nên phụ thuộc vào công nghệ. Các nhu cầu cho các cơ chế phức tạp và tự nhiên mà vẫn đảm bảo sự tương tác hiệu quả và liền mạch với con người luôn dành được sự quan tâm cao. Chính vì lý do này lý do tại sao WaveNet đang được theo dõi, đầu tư chặt chẽ bởi các công ty nghiên cứu về Trí Tuệ Nhân Tạo.

Từ khoá

A.I giọng hát google google deepmind trí tuệ nhân tạo wave net

Bình luận

Bình luận mới