English (United States)   Tiếng Việt (Việt Nam)
Chuyển bộ gõ
Tổng hợp tiếng nói tiếng Việt theo phương pháp ghép nối cụm từ
Cập nhật ngày: 03/08/10

Tổng hợp tiếng nói (Text to Speech –TTS) là tiến trình tạo ra giọng nói nhân tạo của người trên máy tính từ dữ liệu đầu vào là văn bản. Một hệ thống TTS gồm hai phần chính: phần đầu FE (front-end) và phần cuối BE (back-end). Phần đầu có hai nhiệm vụ cơ sở. Trước tiên FE nhận văn bản và chuyển đổi các ký tự như các chữ số hay các chữ viết tắt sang dạng viết đầy đủ. Quá trình này được gọi là quá trình chuẩn hoá hay tiền xử lý văn bản. Sau đó FE sẽ chuyển từng từ thành các đơn vị ngữ âm, rồi phân chia đánh dấu văn bản thành từng đoạn, từng câu, hay từng cụm từ. Quá trình chuyển từng từ sang các đơn vị ngữ âm được gọi là phép chuyển văn bản sang âm vị (text-to-phoneme). Các đơn vị ngữ âm và các thông tin về ngữ điệu của đoạn văn kết hợp với nhau tạo nên thể hiện biểu tượng ngôn ngữ - đây chính là đầu ra của FE. BE nhận diện biểu tượng ngôn ngữ từ FE và chuyển nó thành âm thanh.

Abstract:This paper describes the creation of a limited domain text-to-speech system that are constrained to football commentaries. The system is based on unit selection synthesis. Syllables are automatically segmented by using our speech recognizer and then use as basic
units in the baseline system. Moreover, due to the limited domain (football), the units have been expanded to phrases. Experimental results showed that this systems generates quality speech, compared to other systems.
 
 I.      GIỚI THIỆU
 
Tổng hợp tiếng nói (Text to Speech –TTS) là tiến trình tạo ra giọng nói nhân tạo của người trên máy tính từ dữ liệu đầu vào là văn bản. Một hệ thống TTS gồm hai phần chính: phần đầu FE (front-end) và phần cuối BE (back-end). Phần đầu có hai nhiệm vụ cơ sở. Trước tiên FE nhận văn bản và chuyển đổi các ký tự như các chữ số hay các chữ viết tắt sang dạng viết đầy đủ. Quá trình này được gọi là quá trình chuẩn hoá hay tiền xử lý văn bản. Sau đó FE sẽ chuyển từng từ thành các đơn vị ngữ âm, rồi phân chia đánh dấu văn bản thành từng đoạn, từng câu, hay từng cụm từ. Quá trình chuyển từng từ sang các đơn vị ngữ âm được gọi là phép chuyển văn bản sang âm vị (text-to-phoneme). Các đơn vị ngữ âm và các thông tin về ngữ điệu của đoạn văn kết hợp với nhau tạo nên thể hiện biểu tượng ngôn ngữ - đây chính là đầu ra của FE. BE nhận diện biểu tượng ngôn ngữ từ FE và chuyển nó thành âm thanh.
Các hệ thống TTS có nhiều ứng dụng trong thực tế. Ví dụ như nó có thể giúp cho người khiếm thị nghe được máy đọc ra nội dung của văn bản. Hệ thống TTS cũng có thể được lắp đặt trong các phần mềm xử lý văn bản hay trình duyệt Web. Tuy nhiên khả năng áp dụng nhiều nhất của TTS là ở các ứng dụng hỏi đáp trực tiếp giữa người và máy. Chính vì khả năng ứng dụng thực tiễn lớn như vậy cho nên trên thế giới, các nghiên cứu về TTS đã được thực hiện rất sớm, từ những năm 1930 và tiếp tục phát triển đến ngày nay [11,12].
Hai tính chất quan trọng của chất lượng hệ thống tổng hợp tiếng nói là mức độ tự nhiên và mức độ dễ nghe. Mức độ tự nhiên chỉ sự giống nhau giữa giọng tổng hợp và giọng nói tự nhiên của người thật. Mức độ dễ nghe chỉ đến việc câu phát âm có thể hiểu được dễ dàng không. Một hệ thống tổng hợp tiếng nói lý tưởng là phải thỏa mãn ở mức tối đa hai tính chất này. Trong thực tế, một số hệ thống thiên về mức độ dễ nghe hơn, hoặc mức độ tự nhiên hơn tùy thuộc vào mục đích và công nghệ được lựa chọn.
click để xem chi tiết


Ý kiến của bạn Gửi cho bạn bè In bài này Trở lại
Tin theo ngày Xem
FocusNews Các tin mới nhất

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 1/2012

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 12/2011

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 11/2011

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 10/2011

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 9/2011

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 8/2011

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 7/2011

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 6/2011

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 5/2011

Intel giới thiệu công nghệ kết nối mới Thunderbolt

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 1/2011

Giới thiệu Tạp chí Kỳ 1 Tháng 12/2010

Giới thiệu Tạp chí Kỳ 1 Tháng 11/2010

Giới thiệu Tạp chí Kỳ 1 Tháng 10/2010

Giới thiệu Tạp chí Kỳ 1 tháng 9/2010

Giới thiệu Tạp chí Kỳ 1 Tháng 8/2010

Giới thiệu Tạp chí Kỳ 1 Tháng 7/2010

Giới thiệu Tạp chí Kỳ 1 Tháng 6/2010

Giới thiệu Tạp chí CNTT&TT Kỳ 1 tháng 5/2010

Giới thiệu Tạp chí CNTT&TT Kỳ 1 tháng 4/2010

Giới thiệu Tạp chí CNTT&TT Kỳ 1 tháng 2/2010

Giới thiệu Tạp chí CNTT&TT Kỳ 1 Tháng 1/2010

Giới thiệu Tạp chí CNTT&TT Kỳ 1 tháng 12/2009

Bạc Liêu: Quy hoạch phát triển báo chí in đến năm 2020

Internet vệ tinh đến vùng sâu vùng xa VN

MegaVNN: Tặng khách hàng đến 18 tháng cước sử dụng dịch vụ

Sở Thông tin và Truyền thông Gia Lai

Từ 1/9: VNPT giảm một loạt cước dịch vụ viễn thông

Trường “bốn nhất” đã khai trương

<a href="http://ict.aivietnam.net/news/paggingincategory/tabid/76/catid/17/language/vi-VN/Default.aspx">Các tin đọc nhiều nhất</a> Các tin đọc nhiều nhất
banner 1
EvaVN
justhost.com