即时交互式问答系统的设计与实现(3)

来源:南粤论文中心 作者:呼大力1高3,陈思红1 发表于:2010-04-03 10:59  点击:
【关健词】交互式闻答系统;同麟推荐;客户端/服务器;用户建模
统在推荐时确保每个问题为每位用户只推荐一次,显然,QR (瓤)=Qea2(u;)-e垃Rc(越|)UaPe(uj)穰Q∥(撑f)=QRc (uj)UQee(uj).此外,躐登出系统、提闻者爨出系统淡藏 被其他用户解答等原因而导致。光法解答的问题则不

统在推荐时确保每个问题为每位用户只推荐一次,显然,QR
(瓤≠)=Qea2(u;)-e垃Rc(越|)UaPe(uj)穰Q∥(撑f)=QRc (uj)UQee(uj).此外,躐‰登出系统、提闻者爨出系统淡藏 被其他用户解答等原因而导致“。光法解答的问题则不会被 算入这些集仓中.下藏将详细描述用户模型的学.习算法。
4。2。l鼹户兴趣度鼹掌簿 用户兴趣度展示了用户对每一个知识领域是否感兴趣,
并在一定程度上体现了该用户是否愿意回答该领域问题.用
户毪对于镁域据注岛对应酶翔识镁域的兴趣纛疫氧可数邀 公式(3)计算得出:
 
标注,同时每个领域标注对应一个知识领域.在本文中。A是 半鑫动擒建的,首先扶历史闼答对中抽取高频的、有独焱舍义
如:—塾
≮善÷.撑蝇

邸(3’)
 
的名谲及名谲短港,并获中除去簿禁用词(Stop     Word)得鬟

本文采用归一化的领域标注词频向爨y表示问题的特
Ti万高酉i西珂莉丽丽叨,
 
的.

征。翁定霹题q,妖q)鸯鲡下公式褥嚣,其巾Occ(a;,譬)表示
‘.               -哪,    2 1+卢×b(“,,a.)+occ(a,,QF(吩)oQeC(u/))

(4)
 
occ(口。,Q)=:警)occ(al,qt),gt EQ     (5)
其中Z,Cuj,a,)表示用户磁是否将标连a,设置势敏感词汇,妇 祭是受lj b(a,)等于l,反之西<a。)等乎0.声为敏感词汇权黧, 程本文中.8=10.Ⅳ(Q)表示问题集合Q中问题的数目,Occ (啦,Q)表承标连q在Q中出现的频率,该值可出公式(5)褥 潮。魏终,零文透过双黧,)=<吞,‰,⋯,‰>表示矮声毪对
所有领域的兴趣程度.从以上公式中得出,每位新注册用户对
每个领域的i  real初始德均为l,如果用户设鬣了敏感词汇, 都么该词汇赡应领域的i   real攮将增燕露每当照户薤绝弱答 问题时,该用户对此问题相关领域的兴趣值将受极大的惩罚; 但是,随着用户主动寻找并解决该领域的问题,这种惩罚的影 响会逐渐缩小。
碡.2.2雳户权威度酹擎露 用户权威度用于评估用户在慕一个领域的知识是否串
窝,是否为谈领域的专家,同时也体现了用户在对待推荐问题
时的态度,怒秀能够积极霹答被推荐的闻题。投藏蒡l户在鏊答 该领域问题时,不但按时解决问题的可能性较高,而且所提供 答案也较为准确.用户蜥在领域标涟a。对应的知识领域的权
藏性靠可以凌公式《6>计算零擘出.
咏=acc#x口码                    (6) 钟勺
缎l受:塑妄!丝!望垒鬯!芝!!
occ(aI,QRC(u.,)UQRE(uj”+occ(al,QF(uj))+1
嬲一个积极憔不高的用户被推荐过多的问题时,常常导
致所推荐问题不熊在规定时间内被回答.例如:问题“苏州今 天酶天气怎么群?”的有效期仅为受天,如果该凌瑟褴推荐至 某厌恶回答问题的用户处时。很可能将谈问题拖延至失效.对 此,本文通过分析用户负载能力来控制每位用户被推荐问题 的数瓣,泼缲诞蝴题鳇霾答搴,并尽霹筑分摊至所毒耀关震 户,充分调动每个用户的参与程度,挖搦出潜在专家.用户鳓 负载能力c。可按如下公式进行计算.

。                    c÷一l
《=二夤一+log(兢二l≤QC(稚f))+2)

QC(uj)=QFC(“,)Ua煅c(“,),c7=co         (9)
,其中,t表忝用户ui在第露个男的受载裁力详旗德。梭。 (QC(口,))表示孺户码在第“1个胃中按时解决的随疆数目, 这些问题包括被推荐的问题和用户主动寻找的问题.从以上 公式娜以看出。用户球;在第k个月的负载能力评估德是根据 该嫣户在筹如l令月的评绩德浚及毽在第奄.1个胃酶裘褒共 同决定的.在本义巾,初始能力值岛设为5.图2展糸了某用 户负载能力随着每个月回答问题数目的变化情况.


(8)

其中accj,表示坼尝试回答领域a,中的同磁时的正确率, 该值越高。那么表明该用户在此领域越专业,他为该领域的 翘题所提供的答案可信度就越高.避用户拒绝回答某同题 时,剃对该阏题嚣涉及领域豹acc德没有任何影响.嚣ff袭 承“,面对被推荐问题时的可靠性.巡用户无法解决被推荐的 问题时,他应当及时予以拒绝.如果该用户不佩没有拒绝这
壁阕题嚣量寒毙按爵解答,刚说骥该震户责任感不强,碱
豹值将减小. 例如,小明在问答系统中曾经被推荐过100个有关“计算
机”领域的闽题,其中60个问题被按时憋决,5个问题被抠
绝,12个同题没有在裁定时闰蠢完成,23个阕聪因鬟瓣者登 出等原因被取消.另外,小明曾经主幼寻找过200个有关“计 算机”领域的问题,其中150个问题设按时解决.如果小明注
瓣时夔将“键.算视”佟为敏感逯汇,酃么毽在“计算规”矮域翁
i.rerael值al与,.权r威ea性l棚如下..蹦";爿饕胖。262.2
础口小c口硝小.硝。.忡。算忡机算.机=于。至=于1j至5jj0j猛猛+面而—60石=0=.‘7777
峨孵.-盼算机-=善;=伐82

口小曩=O.83X o.72=o.59
4.2.3用户负栽能力的肇习
0   I           2     3     4   5     6     7
时问(月)

图2矮声负载能力馕变化藏线鎏 Fig。2    Relation between the capacity and monthly answering count
4。3阚题调度模块 巍某闻题从优先级队梦lj巾取出泼詹,将由本模块推荐至
合适的用户处回答.本模块为簿位在线用户“,维护一个问题(责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)

顶一下
(0)
0%
踩一下
(0)
0%


版权声明:因本文均来自于网络,如果有版权方面侵犯,请及时联系本站删除.