用上下文关联和多种什么机器填詞语学习方法分析了极 性词在某一领域内的极性
基于什么机器填词语学习的词语和句子极性分析
蔡健平,王琳琳林世平
福建省福州大學数学与计算机科学学院计算机系350002
laocai800@126.tomwanglinlin07@163.tomsplin@fzu.edu.cn
摘要:近年来,主观性文本(意见)挖掘研究十分活跃主要特点是分析文本中包
含的主观观点并计算其語义极性。这类研究可广泛应用于信息过滤、智能电子商务、意
见反馈、民意调查等词和句子的极性分析是意见挖掘的一个重要处理层佽。我们从这
两个基础环节入手构建了基础极性词典,用上下文关联和多种什么机器填词语学习方法分析了极
性词在某一领域内的极性接着,并分别用词语和Bayes方法计算句子的极性
关键词。意见挖掘语义倾向极性分析观点分析
WordandSentencePolarityAnalysisBasedonMachine
JianpingCaiWangLinlin,ShipingLin
DepartmentofComputerScienceintheCollegeofMathandComputerScienceFuzhou
University,Fujian350002
laocai800@126.tomwang_linlin07@163.comsplin@fzu.edu.cn
.Abstract:Inrecentyears,subjectivetext(opinion)miningveryactivethemain
characteristicistoanalyzethesubjectiveviewsincludedinsubjectivetextandcomputethesemanticpolarity.TheseresearchesCallbewidelyusedininformationfiltering,intelligente-commerceopinionfeedbackandpubHcopinionsurveys.Analyzingthepolarityofwordsandsentencesisanimportantlinguisticlayer.Sowebeginwiththem.andbuildafoundationpolaritydictionaries,analyzeofthepolarityofawordinaparticularfieldwiththeuseofcontextualconnectionandvariousmachinelearningmethods.AndthenwecomputesentencepolarityusingwordsandBayesianmethods.
KeyWords:OpinionMiningsemanticorientation;Polarityanalysis;sentimentanalysis
在文章或论坛中,某一类句子往往包含了作者的主观性思维、观点识别絀这些主观文
本中带有的倾向性,不仅可以帮助理解篇章的写作目的和作者的态度立场而且可以方便生产厂商阅读、总结客户的反馈意見。由于自然语言表达的多样性如何发现并理解这类主观倾向文本也是近年来文本挖掘、意见挖掘的一个难点、重点。目前国内外的研究十分活跃,主要从多个层次来分析这些主观倾向性:词汇、句子、段落、篇章
我们简要介绍这几个方面:(1)词汇。判断词汇中包含的倾向性(极性)是众多意见挖
掘系统的基础如何构建一个比较完全的极性词典也就成了挖掘过程的基础环节。词汇的研究主要是基础极性词汇和领域极性词汇(2)句子。这层次的问题主要也有两方面:~是如何有效地找出极性句子即在文本中把主观句子与客觀句子分开,二是怎样准确地判断句子的极性即把主观句子分为褒义、贬义或中性。(3)段落段落的极性分析,是把若干个旬子汾成一个段落进行分析,或直接采用自然段落来分析可以取段落的茸尾句子来分析整个829