Thai NLP Project backlog #724
Replies: 5 comments
-
A few ideas mostly still in planning phase:
If any of these are interesting to you. I can give advice on how to get started on them. |
Beta Was this translation helpful? Give feedback.
-
Hi, I'm interested in working on/supporting the Text-to-speech issue, please let me know if anyone else is :) |
Beta Was this translation helpful? Give feedback.
-
Greetings, I'm currently looking into auto-correct model for automated Thai subtitle creation but lacking the dataset. I have about 200-500 sentences and somewhat working subtitle segmentation service(S2T transcript -> human readable sub). I think I can help gathering the subtitle dataset. I will gladly be of assistance 😄. |
Beta Was this translation helpful? Give feedback.
-
For YouTube subtitle dataset. Here's the current resources & work-in-progress.
These are human-made Thai subtitles. We can compare it to Google Speech-to-Text result. And make an auto-correct model. Here's some more scripts to make it easier.
To-Do
|
Beta Was this translation helpful? Give feedback.
-
ขอใช้ภาษาไทยนะครับ ผมเคยทำ text to speech ด้วย Tacotron โดยใช้ชุดข้อมูล TSynC-1 Corpus แต่เสียงที่ได้แม้ train ไป 1 ล้าน ep ไม่สามารถสังเคราะห์เสียงออกมาเป็นประโยคได้เลยครับ แต่ก็มีคนเคยลองทำด้วย Tacotron 2 โดยใช้ชุดข้อมูลที่สร้างจาก Google text-to-speech อีกที ออกมาเสียงโอเคอยู่นะครับ https://link.medium.com/KJeFCYpck6 ส่วนผมเคยทำ text-to-speech อีกตัวที่ https://github.com/PyThaiNLP/tts-thai โดยใช้เครื่องมือของ Google ร่วมกับ TSynC-1 Corpus ออกมาโอเคอยู่ครับ แต่ผมไม่ได้ทำ G2P เลยไม่รองรับการใส่คำที่ไม่มีใน dict ลงไปสังเคราะห์ครับ |
Beta Was this translation helpful? Give feedback.
-
If you are interested in supporting Thai Natural Language Processing (ThaiNLP), We have a backlog.
If you are doing these things, Do not forget to inform us on this issue.
Thank you.
Beta Was this translation helpful? Give feedback.
All reactions