Posts Tagged ‘NLP’

  • HMM学习笔记:初识隐马尔科夫模型

    Date: 2008.10.22 | Category: Algorithm | Response: 0

    HMM是Hidden Mar­kov Model的缩写,是马尔科夫模型的过程概率函数。这种模型在现在语音识别系统构建中起到了十分重要的作用。

    最近通过学习HMM,基本上理解了这种算法模型。感谢公司同事William和Yong的精彩课程,让我能够很快地理解。

    ======================================

    关于HMM的入门,有一些网上的作品写的很好,值得借鉴:

    http://hi.baidu.com/myqa/blog/item/1882224f026c4535aec3abe3.html

    http://life.tongji.edu.cn/biforum/viewthread.php?tid=296&extra=page%3D1%26amp%3Bfilter%3Ddigest

    http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html

    =======================================

    马尔科夫模型是一种基于预测的概率模型。在语言学的实践中,甚至在一般数理统计中,我们经常会考虑这样一种情况序列,这组序列由并不相互独立的随机变量组成,序列中的每个元素的变量值依赖于它前面的元素。给定了一个元素,为了能够预测到它的继任(succe­ssor),我们会分析这个序列中相关元素与其继任出现的概率,并最终给出一个下一个最有可能出现的情况。而马尔科夫模型就是解决完成这样的问题而出现的。

    在马尔科夫模型中,我们根据已知的整个序列,加上出现的这个元素,来预测即将出现的元素的可能性。而在大多数情况中,我们无法得知整个序列,只能得到序列中的一部分,一个片段。这个时候用马尔科夫模型就不够了,要使用隐马尔科夫模型。隐马尔科夫模型可以根据表层事件中的一些现象来分析判断底层中事件的情况,反之亦然。即,当系统中出现表层事件是由底层事件所引发相关的问题时,HMM便可以派上用场了。

    利用HMM,我们可以由表层事件的发生和模型来判断底层事件的发生;可以根据底层事件和模型来预测表层事件的发生;还可以根据表层事件和底层事件,来估计整个模型(参数估计)。这是HMM的三大作用,三个基本问题。

    =======================================

    参考书:

    http://www.china-pub.com/22710

    http://club.book.csdn.net/book/28296.html

    接下来的一段时间里,我想将自己对于整个HMM模型的理解和演算过程加以记录和整理,方便大家一起学习。也加深一下印象。

    • Share/Bookmark
  • BUSY Days come up

    Date: 2008.09.10 | Category: In My Opinion | Response: 1

    最近一段时间,觉得时间很不够用。有太多的事情需要去做,太多的知识需要去学习。每天,经常是一到了公司,就开始忙活起来,直到中午吃饭;以前的中午,大多和同事们去打打桌面足球,而现在除了简单的休息,就要继续学习,继续做事情了。

    最近的工作任务虽说不太多,但是也比较繁杂,占据了一部分时间。但最大头还是学习。参加了公司的Lea­r­ning Group,学习Python,学习NLP;自己也在Unix-Center.net上开了一门跟自己的工作蛮贴近的Unix Shell方面的课程。每周都要花掉不少时间来准备教程。再加上学校的综合实践,自己接的两个项目……快疯掉了。。。。

    有时候就想,忙死算了…… 虽然事情是有个轻重缓急的,但是哪个似乎都耽搁不起。。要么是公司的事情,要么是学校的事情,更要么就是接的项目。。把我劈成两个人来完成该多好啊。。

    另外,在学习NLP时,发现自己的概率知识又忘掉了很多,需要恶补一下了。
    =======================

    对了,再补充一下,9月20日在本部有个Software Free­dom Day的活动,我有个关于Open Source的Presentation,欢迎大家去啊,嘿嘿。具体地点和时间还不清楚。

    • Share/Bookmark

Paul’s Online Services

Dynamic Tag Cloud

Recent Posts

Recent Comments

Tags

2008.11.Trip-of-GuangXi ASP.net C++ China Chrome css dotNet FCGuoAn Firefox Football gmail IBM IE IIS IT Association Joke Microsoft music mysql NLP Nokia ntfs NumPy OpenSolaris open source Open Team php pidgin PKUSS Python Python Challenge qq Samba SciPy Learning shell solaris SQL SUN Thunderbird Travel web host Win 7 WordPress X11 zfs