搜索
首页 其他

全唐诗检索

1.如何使用OracleText进行全文检索

由于系统中数据不断增多,使得原用的like语法来进行查询法律全文变得十分缓慢,因此在原有系统中增加了全文检索的功能。

全文检索功能依赖于Oracle Text。首先保证Oracle Text组件在数据库中已安装

然后建立索引 Sql代码 --法律全文内容字段增加索引 create index idx_flqw_nr on flqw(nr) indextype is ctxsys。 context; --法律条款字段增加索引 create index idx_fltk_nr on fltk(nr) indextype is ctxsys。

context; 由于Oracle Text使用的ctxsys。context类型索引不会自动维护,因些需要定时进行更新索引并进行索引优化,索引优化的次数要稍微少些。

Sql代码 --更新索引 exec ctx_ddl。sync_index('idx_flqw_nr'); exec ctx_ddl。

sync_index('idx_fltk_nr'); --优化索引 exec ctx_ddl。optimize_index('idx_flqw_nr','full'); exec ctx_ddl。

optimize_index('idx_fltk_nr','full'); 也可以将更新索引及优化写成job,这样可以定时运行,该job要与用户建立在同一个目录下。 先创建相对应的存储过程。

Sql代码 --给flyy用户赋予在存储过程中执行全文索引的权限 GRANT EXECUTE ANY PROCEDURE TO flyy;。

2.关于唐诗检索

No.598 郊庙歌辞:郊庙歌辞 享太庙乐章 景云舞 (第13卷)

No.3367 张说:唐享太庙乐章 景云舞 (第85卷)

No.14429 皇甫澈:赋四相诗 并序 中书令钟绍京 (第313卷)

No.25865 李商隐:景阳井 (第541卷)

No.28015 温庭筠:照影曲 (第575卷)

No.29940 陆龟蒙:添酒中六咏 并序 酒枪 (第620卷)

No.30434 司空图:秋景 (第632卷)

No.30488 司空图:红茶花 (第633卷)

No.32731 唐彦谦:春残 (第672卷)

No.33297 韩∥:闲兴 (第681卷)

No.33402 韩∥:永明禅师房 (第682卷)

No.35299 钱?:江行无题一百首 60 (第712卷)

No.36600 陈贶:景阳台怀古 (第741卷)

No.38785 孙氏:白蜡烛诗 (第799卷)

No.40210 栖白:寿昌节赋得红云表夏曰 (第823卷)

No.43353 孙光宪:后庭花 (第897卷)

3.《全唐诗》有哪些内容

《全唐诗》由清朝康熙年间的彭定求、杨中讷、沈三曾、潘从律、徐树本、车鼎 晋、汪绎、查嗣瑰、俞梅10人奉敕编纂,最 后由曹寅具体负责刊刻事宜。

全书共900余 卷,收录2200多人的诗歌作品48900余首。 它是在明代胡震亨《唐音统签》和清初的季 振宜《唐诗》的基础上,旁采残碑断碣稗史 杂书所载,拾遗补阙,汇聚而成的诗歌总 集,既包括已结集者,又含有散逸者。

书中 把帝王后妃作品罗列于前;其次为乐章、乐 府;接着是历朝作者,按时代先后编排,附 以作者小传;最后是联句、逸句、名媛、僧、道士、仙、神、鬼、怪、梦、谐墟、判、歌、谶记、语、古谚、民谣、酒令、占 辞、蒙求,而以补遗、词缀于末。它不仅收 集了唐代著名诗人的集子,而且包含一般作 家及各类人物的作品,全面反映了唐诗的繁 荣景象,不失为一部资料丰富和比较完整的唐代诗歌总集。

4.《全唐诗》是谁写的

《全唐诗》共900卷,是清康熙曹寅、彭定求等奉敕编纂。

康熙四十四年(1705年)三月,康熙在第五次南巡时,将主持修书的任务交给时任江宁织造的曹寅。同年五月,由曹寅主持,在扬州开局修书,参与其事的有彭定求、沈三曾、杨中讷、潘从律、汪士弦,徐树本、车鼎晋,汪绎、查嗣璨、俞梅等十人,以明朝胡震亨《唐音统签》、清朝初年季震宜《唐诗》两书为底本进行增订,至次年十月全书完成,是为《全唐书》。

该书卷帙浩繁,共收录唐诗48900多首,作者2200余人。诗人均按时代先后排列,后附唐五代词,搜罗宏富,对于研究我国唐代的文学和历史,都具有极大的参考价值。

5.全文检索的原理是什么

全文检索与之相关的议题语根处理(stemming)符素解析器(tokenparser)1gram,2gram,ngram断词/分词wordsegmentation倒排索引invertedindex算法、搜寻策略之模型布尔式boolean统计模型Probabilisticmodel向量空间模型vectorbasemodel隐性语义模型Latentsemanticmodel全文检索系统检索编辑全文检索评量之准则判断检索效果的两个指标:查全率被检出相关信息量/相关信息总量(%)查准率被检出相关信息量/被检出信息总量(%)全文检索开放源代码之全文检索系统ApacheSolrBaseXClusterpointServer(freewarelicenceforasingleserver)DataparkSearchFerretHt//DigHyperEstraierKinoSearchLemur/IndriLucenemnoGoSearchSphinxSwisheXapianElasticSearch全文检索议题优化编辑全文检索和中文有关的议题断词(分词)语法解析古籍议题多语言混合全文检索优化剔除字(Stopwords)词性标注权威档(authorityfile)知识体系,本体论(ontology)超链接分析(pagerank)技术全文检索历史及未来之趋势自由语句搜寻基于自然语言的分词。

范文涉及成语
作文大全
总结报告
演讲致辞
心得体会
领导讲话
党建材料
常用范文
应用文档
论文中心
推荐购买
范文 | 名句 | 成语 | 杂谈 | 词典 | 字典 | 拼音 | 谜语 | 拆字 | 造句 | 诗词上一句 | 诗词下一句 | 名字赏析 | 其他 | 天气诗词 | 热门搜索 Copyright © 湘ICP备17014254号-2