pinyin2hanzi

这是一个可以将输入的拼音转为汉字的程序。在拼音转汉字的过程中使用了隐马尔科夫模型和维特比算法。

程序是如何分音的？

当连续输入几个字的拼音时，程序会对每相邻的两个拼音连续出现的概率做计算。对于出现概率很少的拼音认为这里是两个字的拼音分割处。

这样分音会将类似西安这样的词语的分音错误分割。所以，这里还会对每一个已经完成分音的拼音从后向前扫描。如果发现一个拼音内部出现了另一个拼音，则将这个拼音分为两个独立的拼音。

因为mysql包含有方便的将txt导入到mysql中的方法，所以不需要现将.txt转换为.sql在执行了。也就是gen_sql.py文件其实已经没用了。

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
dic		dic
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
emission.sql		emission.sql
emission.txt		emission.txt
gen_sql.py		gen_sql.py
init.py		init.py
load_data_to_db.md		load_data_to_db.md
main.py		main.py
pinyin_prob.txt		pinyin_prob.txt
pinyin_word.txt		pinyin_word.txt
result		result
start.sql		start.sql
start.txt		start.txt
start2.txt		start2.txt
trans.sql		trans.sql
trans.txt		trans.txt
trans2.txt		trans2.txt