以文本方式查看主题 - 计算机科学论坛 (http://bbs.xml.org.cn/index.asp) -- 『 Semantic Web(语义Web)/描述逻辑/本体 』 (http://bbs.xml.org.cn/list.asp?boardid=2) ---- 请大家给些意见——基于本体的卡拉OK点歌系统 (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=56867) |
-- 作者:daniel_tu -- 发布时间:12/17/2007 4:51:00 PM -- 请大家给些意见——基于本体的卡拉OK点歌系统 小弟最近也在研究本体,看了些本体的相关知识,总的感觉,本体的概念很虚也很广,所有的客观事物都可以用本体来描述,学习本体也需要从一个较小也比较实际的例子出发,对其进行建模和推理。老师给我的课题就是将本体应用到当前的卡拉ok点歌系统中,实现对歌曲信息的语义搜索,大家认为这个课题可以就什么成果吗?此外,我认为本体过程中的难点和关键是本体的构建,大家在这方面有什么建议和指导?谢谢,不胜感激! |
-- 作者:tfn1981 -- 发布时间:12/17/2007 11:03:00 PM -- 这样一个东西有必要做本体吗? |
-- 作者:whfcarter -- 发布时间:12/18/2007 10:57:00 AM -- 同意楼上的意见,有3个问题必须解决, 1) 为什么要用本体? 2) 用了的好处比不用好在什么地方? 3) 还有你构建和维护的代价多少? 一句话,就是不能为用本体而用本体。 |
-- 作者:daniel_tu -- 发布时间:12/18/2007 5:14:00 PM -- 我自己也不知道这个实例中能不能结合本体做些研究,不过我个人认为在某些歌曲检索方面可以用到本体,例如影视歌曲又可以分为电视原声、电影原声、动漫音乐等子分类,当搜索影视歌曲信息时,只能检索出类型字段为影视歌曲的信息,但是很显然电视原声、电影原声、动漫音乐等歌曲明显也属于影视歌曲,是否可以借鉴本体的推理机制获得信息呢? |
-- 作者:whfcarter -- 发布时间:12/18/2007 9:47:00 PM -- 楼主举的例子确实是本体建模以及相应推理能力的一个表示,也是大家在semantic search经常会举的case来说明比传统search的好处。不过大家这么说的时候也忽略了一些因素,现在的web search的scalability能力要比semantic search好很多,而且如果semantic search需要借用reasoning,有另外一些局限(e.g. incomplete knowledge, uncertainty, inconsistency等)。所以是否选用semantic search还是要看你的规模,像semantic web并没有吸引google, yahoo, microsoft的兴趣,因为他们要面向end users,而吸引了如IBM, HP以及oracle的兴趣,因为他们面向的客户是enterprise users,在那里有很复杂的结构化信息,同时又很多规则等,所以在enterprise scale以及相关的search上,ontology是很有用的。但是从web scale来说,challenges比较大,所以可能楼主需要就这点考虑一下。然后就你举的例子我觉得很多也考虑的不深入,按照上述的例子,其实就是一个taxonomy,然后我要完成你的功能可能就是一个query expansion的工作。如果有更加复杂的关联关系呢?ranking如何做呢?希望我的一些拙见对你有帮助。 找合适自己的。 |
-- 作者:daniel_tu -- 发布时间:12/18/2007 10:41:00 PM -- 首先谢谢楼上的建议。纵观当前本体的研究,大部分都是理论型的居多,老师的意思是让我将本体的一些思想应用到点歌系统中,实现歌曲信息的语义搜索,而不是研发出一种新的系统用于取代当前的系统(of cource , in my opinion, the current system is perfect)。我觉得本体在该系统中还有以下几方面的用途: 1、同义词搜索。例如根据主题搜索,比方说要检索“歌颂春天”的歌曲,歌曲中存在"Spring"的信息也应该出现在检索结果中。 2、如果某首歌我只记得一两句歌词,是否能够查询出是哪首歌曲呢? 3、可以创建一个关于歌曲类别的领域本体 4、例如香港歌手“刘德华”的英文名为“Andy Liu”,当我要检索所有歌手为“刘德华”的歌曲信息时,数据库中歌手名为“Andy Liu”的歌曲信息也应当出现在结果中。 以上是我的愚见,请楼上指教。 |
-- 作者:jpz6311whu -- 发布时间:12/18/2007 11:34:00 PM --
这些功能不用本体技术也可以做,就用数据库建几个表很容易出来。。 |
-- 作者:whfcarter -- 发布时间:12/19/2007 11:07:00 AM -- 1、同义词搜索。例如根据主题搜索,比方说要检索“歌颂春天”的歌曲,歌曲中存在"Spring"的信息也应该出现在检索结果中。(这点和前面的同义词原本的含义不一致,感觉是多语言的互相映射,当然勉强也可以算吧) 2、如果某首歌我只记得一两句歌词,是否能够查询出是哪首歌曲呢?(这点是否类似于keyword search呢,从一些关键字,不完整的信息找到对应的文档) 3、可以创建一个关于歌曲类别的领域本体(如果你看过enrico motta的the next generation semantic web application之后你就会意识到你这个不是一个好的选择,因为你不是domain experts,你这个ontology也不代表大家对于该领域的共同认识,因此为什么不reuse别人定义好的知识呢,e.g. musicbrainz等) 4、例如香港歌手“刘德华”的英文名为“Andy Liu”,当我要检索所有歌手为“刘德华”的歌曲信息时,数据库中歌手名为“Andy Liu”的歌曲信息也应当出现在结果中。(这点从例子上看和1类似,spring对应春天,不过个人跟认为这个是一个entity resolution的问题,请参看Information Extraction的相应技术) 最后总结一下,1) 在阐述功能时希望避免出现具体技术实现,如4中出现数据库,因为功能还不清楚,如果把技术混入,不利于把问题和真正的contribution想清楚 2) 从个人角度来看1,4更加偏重于semantic web creation,我很关心你这些对应的同义词或者object consilidation如何完成的,原来处理的数据是什么形式的,web corpus or RDF? 还有你对于multimedia信息如何进行标注的 3) 从本身的search功能来看,2算是一种类似IR的search,其实还有对于返回的结果通过原来的band或者其他类别,属性信息通过faceted方式来展现结果,还有一个ranking问题,同时我这里很想知道你的具体数据是不完整的曲子呢还是人随便哼一段还是传统的本文输入 4) 如果已经有了数据,你需要考虑你对应的data model怎么来表示那些语义关系(参考一下SKOS, W3C的一个标准,帮助表示同义和不同语言之间的映射),然后考虑如何存储和索引。 p.s. 楼上的可能忽略了一点,2这个功能并不适合用db来完成。按照现在的功能描述,一个inverted index就可以搞定,然后如何利用inverted index来存SKOS等,参考都灵冬奥会的semantic search engine Squiggle,你可以通过google找到相应的文章。 |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
81.055ms |