`
zha_zi
  • 浏览: 585394 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

solr第一弹 autocomplete(自动补全)

阅读更多

 

         百度和google中都有文字的自动补全功能,以前项目中也用过实现思路非常简单一般就是extjs 或者jquery 的前台插件通过异步加载数据然后显示,

          现在项目的数据源是基于solr所以只有使用solr的autocomplete功能,搜索了很多无数 百度上的 网页根本没有关于solr的自动补全的功能实现,就连关于solr应用性的文章也是比较少的,无奈只好在google上搞了,全都是英文的,尝试了很多的方法都不能使用最后发现是solr api的问题国外的大部分资料都是用得这个写法

private List<Term> query(String q, int limit) {
    List<Term> items = null;
    CommonsHttpSolrServer server = null;

     try {
         server = new CommonsHttpSolrServer("http://localhost:8983/solr");
     } catch(Exception e) { e.printStackTrace(); }

     // escape special characters
     SolrQuery query = new SolrQuery();
     query.addTermsField("spell");
     query.setTerms(true);
     query.setTermsLimit(limit);
     query.setTermsLower(q);
     query.setTermsPrefix(q);
     query.setQueryType("/terms");

     try {
         QueryResponse qr = server.query(query);
         TermsResponse resp = qr.getTermsResponse();
         items = resp.getTerms("spell");
     } catch (SolrServerException e) {
      	items = null;
     }

     return items;
}

 但是不知道是人品问题还是怎么的,我下载的solr1.4  SolrQuery类根本就没有这个addTermsField 和setTermsPrefix 方法,

这是我的下载地址http://mirror.nus.edu.sg/apache//lucene/solr/1.4.1/

 

solr实现autocomplete功能其实非常简单,仅仅需要下边的这个url就可以实现

fl=id,name&rows=0&q=*:*&facet=true&facet.field=name_auto&facet.mincount=1&facet.prefix=input

 我们所要做的就是用solrj的api拼装成这个字符串请求tomcat就ok了

下面是拼装代码

CommonsHttpSolrServer service = new CommonsHttpSolrServer(
				"http://localhost:8080/solr/targetCore");
		List<Term> list = new ArrayList<Term>();
		QueryResponse queryResponse = new QueryResponse();
		SolrQuery query = new SolrQuery();
		// fl=id,name&rows=0&q=*:*&facet=true&facet.field=searchText&facet.
		// mincount=1&facet.prefix=sony
		//facet=true&rows=0&fl=id%2Cname&facet.prefix=sony&facet.field=searchText
		try {
			query.setFacet(true);
			query.setRows(0);
			query.setQuery("*:*");
			query.setFacetPrefix("sony");
			query.addFacetField("searchText");
			System.out.println(query.toString());
			queryResponse = service.query(query, METHOD.POST);
		} catch (Exception e) {
			// TODO: handle exception
			e.printStackTrace();
		}

  返回的内容如下



 searchText 中的以sony开头的词都是自动补全的结果,其实这些都是lucene中的term

 

下边代码使用solrj的api解析文本的过程

	CommonsHttpSolrServer service = new CommonsHttpSolrServer(
				"http://localhost:8080/solr/targetCore");
		List<Term> list = new ArrayList<Term>();
		QueryResponse queryResponse = new QueryResponse();
		SolrQuery query = new SolrQuery();
		// fl=id,name&rows=0&q=*:*&facet=true&facet.field=searchText&facet.
		// mincount=1&facet.prefix=sony
		//facet=true&rows=0&fl=id%2Cname&facet.prefix=sony&facet.field=searchText
		try {
			query.setFacet(true);
			query.setRows(0);
			query.setQuery("*:*");
			query.setFacetPrefix("索尼");
			query.addFacetField("searchText");
			System.out.println(query.toString());
			queryResponse = service.query(query, METHOD.POST);
		} catch (Exception e) {
			// TODO: handle exception
			e.printStackTrace();
		}
		NamedList<Object> nl = queryResponse.getResponse();

		NamedList<Object> nl2 = (NamedList<Object>) nl.get("facet_counts");
		NamedList<Object> nl3 = (NamedList<Object>) nl2.get("facet_fields");
		NamedList<Object> nl4 = (NamedList<Object>) nl3.get("searchText");
		System.out.println(nl4.size());
		Iterator<Entry<String, Object>> it = nl4.iterator();
		while (it.hasNext()) {
			Entry<String, Object> entry = it.next();
			System.out.println(entry.getKey() + "____" + entry.getValue());
		}

		SolrDocumentList results = queryResponse.getResults();

		SolrResult solrResult = new SolrResult();
  • 大小: 13.7 KB
分享到:
评论
4 楼 panghaoyu 2017-03-15  
实现一个智能提示功能需要ajax、数据库、jsp/php、算法等很多知识,
如果数据量大,还需要特殊优化
一个小功能,花费太大精力很不划算
我使用了92find.c-o-m的搜索框智能提示功能托管服务,
只要一行javascript代码就可以实现百度、淘宝搜索框提示的全部功能
比如:汉字拼音匹配、拼音前缀匹配、模糊搜索、智能容错,还可以自定义提示词汇及其排序权重
花五分钟我的网站就可以部署同百度、淘宝一样强大好用的输入提示功能
同时兼容IE、Firefox、Safari、Chrome、Opera各种浏览器
兼容ios、Android、Windows
3 楼 飞天奔月 2012-11-20  
ak121077313 写道
额 其实我想知道是怎么抓取页面的。

jsoup 你也可以尝试下
2 楼 zha_zi 2011-04-08  
数据采集不是我负责的,但是我知道是用heritrix-1.14.3.zip这个东西搞得
1 楼 ak121077313 2011-04-08  
额 其实我想知道是怎么抓取页面的。

相关推荐

    python源码基于mediapipe设计实现人体姿态识别动态时间规整算法DTW和LSTM(长短期记忆循环神经网络.rar

    本项目基于Python源码,结合MediaPipe框架,实现了人体姿态识别功能,并进一步采用动态时间规整算法(DTW)和长短期记忆循环神经网络(LSTM)对人体动作进行识别。项目涵盖了从姿态估计到动作识别的完整流程,为计算机视觉和机器学习领域的研究与实践提供了有价值的参考。 MediaPipe是一个开源的多媒体处理框架,适用于视频、音频和图像等多种媒体数据的处理。在项目中,我们利用其强大的姿态估计模型,提取出人体的关节点信息,为后续的动作识别打下基础。DTW作为一种经典的模式匹配算法,能够有效地处理时间序列数据之间的差异,而LSTM则擅长捕捉长时间序列中的依赖关系。这两种算法的结合,使得项目在人体动作识别上取得了良好的效果。 经过运行测试,项目各项功能均表现稳定,可放心下载使用。对于计算机相关专业的学生、老师或企业员工而言,该项目不仅是一个高分资源,更是一个难得的实战演练平台。无论是作为毕业设计、课程设计,还是项目初期的立项演示,本项目都能为您提供有力的支持。

    web期末大作业-电影动漫的源码案例.rar

    本学期末,我们为您呈现一份精心准备的电影动漫源码案例,它不仅是课程设计的优秀资源,更是您实践技能的有力提升工具。经过严格的运行测试,我们确保该案例能够完美兼容各种主流开发环境,让您无需担心兼容性问题,从而更加专注于代码的学习与优化。 这份案例资源覆盖了前端设计、后端逻辑处理、数据库管理等多个关键环节,旨在为您提供一个全面而深入的学习体验。无论您是计算机专业的在校学生,还是对编程充满热情的爱好者,亦或是希望提升技能的企业员工,这份案例都将为您提供宝贵的实战经验。 此外,我们还特别准备了详细的使用指南和在线支持,确保您在学习和使用的过程中能够得到及时有效的帮助。您可以放心下载和使用这份资源,让它成为您学习道路上的得力助手。让我们携手共进,通过实践探索编程的无限可能!

    java图书管理系统毕业设计(源代码+lw).zip

    本设计是为图书馆集成管理系统设计一个界面,图书馆集成管理系统是用MICROSOFT VISUAL Foxpro 6.0 来建库(因特殊原因该用 MICROSOFT Access来建库)。它包括: 中文图书数据库; 西文图书数据库; 发行商数据库; 出版商数据库; 读者数据库; 中文期刊数据库; 西文期刊数据库; 中文非印刷资料库; 西文非印刷资料库; 典藏库; 流通库; 预约库; 流通日志库;

    项目实战+C#+在线考试系统+毕业项目

    该系统主要以在线模拟考试使用为出发点,以提高学生的学习效率和方便学生随时随地检测学习成果为目的,主要采用了DreamweaverMX、FireworksMX、FrontPage软件进行设计、使用ASP开发语言进行编程,所选用的数据库是微软公司开发的Access数据库。 ASP是通过一组统称为ADO的对象模块来访问数据库,ASP提供的ADO对象模块包含6个对象和3个集合,常用的有Connection、 Record set 、Command 、field等对象。 ASP是一种服务器端的指令环境,用来建立并执行请求的交互式WEB服务器端运行的应用程序, ASP程序只能在WEB服务器端执行,当浏览器向服务器要求运行ASP程序时,服务器会读取该程序,然后执行该程序并将结果转换为HTML文件 ,再将HTML文件传送给浏览器,待浏览器收到HTML文件以后,便会将执行结果显示在浏览器上。

    应用背景这个源码包非常适合研究蚁群算法的同学使用,

    应用背景这个源码包非常适合研究蚁群算法的同学使用,其中介绍了蚁群算法的基本程序,有利于各位从中吸取有益经验,也可以结合其它方法进行改善。关键技术蚁群算法应用广泛,在此提供一个可以运行的、完整的源码以供参考,各位可以在此基础上进行改进,改善其在不同场合中的应用效果Matlab.zip

    传递矩阵中矩阵元素的传递与变换.zip

    传递矩阵中矩阵元素的传递与变换.zip

    numpy安装 python -m pip install -upgrade pip

    numpy安装 numpy安装 python -m pip install --upgrade pip

    Qt开发倒计时,设置时间,然后会生产倒计时

    【Qt开发】倒计时,设置时间,然后会生产倒计时。修改其中的时间clocker.h

    机器人监测和玉兴串行通信控制系统vb.zip

    机器人监测和玉兴串行通信控制系统vb.zip

    web期末大作业前端结课大作业仿小米和魅族官网-纯html+css+js项目源码.rar

    本项目是一个基于纯HTML、CSS和JavaScript的Web期末大作业,旨在模仿小米和魅族官网的设计风格和布局。项目源码经过精心设计和优化,运行测试OK,确保了兼容性和稳定性。此外,该项目还提供了详细的课程设计高分资源,为学习者提供了宝贵的参考资料,让使用者可以放心下载并应用于实际学习中。 本资源适合计算机相关专业的在校学生、老师以及企业员工下载。对于初学者来说,这是一个很好的入门学习资源,可以帮助他们快速掌握HTML、CSS和JavaScript的基本技能。同时,该项目也可以作为毕业设计、课程设计、课程作业以及项目初期立项演示的参考依据。 对于有一定基础的学员,可以在本代码的基础上进行更深层次的开发和改进,结合现代前端框架如Vue或React,进一步实现更多高级功能,如动态路由、状态管理、数据交互等,以提高项目的实用性和复杂度。 我们致力于提供高质量的资源,助力您的学习和工作。希望这个项目能成为您成长道路上的得力助手。

    Left Side Arm.sldasm.svlx

    Left Side Arm.sldasm.svlx

    Java项目之人才招聘网站(源码)

    Java项目之人才招聘网站(源码) 开发语言:Java 框架:ssm 技术:JSP JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 5.7(一定要5.7版本) 数据库工具:Navicat11 开发软件:eclipse/myeclipse/idea Maven包:Maven3.3.9

    基于物品的协同过滤算法.zip

    协同过滤算法(Collaborative Filtering)是一种经典的推荐算法,其基本原理是“协同大家的反馈、评价和意见,一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息”。它主要依赖于用户和物品之间的行为关系进行推荐。 协同过滤算法主要分为两类: 基于物品的协同过滤算法:给用户推荐与他之前喜欢的物品相似的物品。 基于用户的协同过滤算法:给用户推荐与他兴趣相似的用户喜欢的物品。 协同过滤算法的优点包括: 无需事先对商品或用户进行分类或标注,适用于各种类型的数据。 算法简单易懂,容易实现和部署。 推荐结果准确性较高,能够为用户提供个性化的推荐服务。 然而,协同过滤算法也存在一些缺点: 对数据量和数据质量要求较高,需要大量的历史数据和较高的数据质量。 容易受到“冷启动”问题的影响,即对新用户或新商品的推荐效果较差。 存在“同质化”问题,即推荐结果容易出现重复或相似的情况。 协同过滤算法在多个场景中有广泛的应用,如电商推荐系统、社交网络推荐和视频推荐系统等。在这些场景中,协同过滤算法可以根据用户的历史行为数据,推荐与用户兴趣相似的商品、用户或内容,从而提高用户的购买转化率、活跃度和社交体验。 未来,协同过滤算法的发展方向可能是结合其他推荐算法形成混合推荐系统,以充分发挥各算法的优势。

    JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书).zip

    JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+access综合测评系统毕业设计(源代码+LW+开题报告+任务书)JAVA+a

    STR710的定时器编程C语言例子,开发环境为IAR EWARM。.zip

    STR710的定时器编程C语言例子,开发环境为IAR EWARM。.zip

    Qt+OpenCV通用视觉框架全套源码.zip.001

    Qt+OpenCV通用视觉框架全套源码.zip.001

    利用协同过滤算法,基于用户历史订单数据,对店铺的用户和商品进行推荐.zip

    协同过滤算法(Collaborative Filtering)是一种经典的推荐算法,其基本原理是“协同大家的反馈、评价和意见,一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息”。它主要依赖于用户和物品之间的行为关系进行推荐。 协同过滤算法主要分为两类: 基于物品的协同过滤算法:给用户推荐与他之前喜欢的物品相似的物品。 基于用户的协同过滤算法:给用户推荐与他兴趣相似的用户喜欢的物品。 协同过滤算法的优点包括: 无需事先对商品或用户进行分类或标注,适用于各种类型的数据。 算法简单易懂,容易实现和部署。 推荐结果准确性较高,能够为用户提供个性化的推荐服务。 然而,协同过滤算法也存在一些缺点: 对数据量和数据质量要求较高,需要大量的历史数据和较高的数据质量。 容易受到“冷启动”问题的影响,即对新用户或新商品的推荐效果较差。 存在“同质化”问题,即推荐结果容易出现重复或相似的情况。 协同过滤算法在多个场景中有广泛的应用,如电商推荐系统、社交网络推荐和视频推荐系统等。在这些场景中,协同过滤算法可以根据用户的历史行为数据,推荐与用户兴趣相似的商品、用户或内容,从而提高用户的购买转化率、活跃度和社交体验。 未来,协同过滤算法的发展方向可能是结合其他推荐算法形成混合推荐系统,以充分发挥各算法的优势。

    实验性基于用户的协同过滤推荐系统.zip

    协同过滤算法(Collaborative Filtering)是一种经典的推荐算法,其基本原理是“协同大家的反馈、评价和意见,一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息”。它主要依赖于用户和物品之间的行为关系进行推荐。 协同过滤算法主要分为两类: 基于物品的协同过滤算法:给用户推荐与他之前喜欢的物品相似的物品。 基于用户的协同过滤算法:给用户推荐与他兴趣相似的用户喜欢的物品。 协同过滤算法的优点包括: 无需事先对商品或用户进行分类或标注,适用于各种类型的数据。 算法简单易懂,容易实现和部署。 推荐结果准确性较高,能够为用户提供个性化的推荐服务。 然而,协同过滤算法也存在一些缺点: 对数据量和数据质量要求较高,需要大量的历史数据和较高的数据质量。 容易受到“冷启动”问题的影响,即对新用户或新商品的推荐效果较差。 存在“同质化”问题,即推荐结果容易出现重复或相似的情况。 协同过滤算法在多个场景中有广泛的应用,如电商推荐系统、社交网络推荐和视频推荐系统等。在这些场景中,协同过滤算法可以根据用户的历史行为数据,推荐与用户兴趣相似的商品、用户或内容,从而提高用户的购买转化率、活跃度和社交体验。 未来,协同过滤算法的发展方向可能是结合其他推荐算法形成混合推荐系统,以充分发挥各算法的优势。

    课设毕设基于SSM的信息类课程教学知识管理系统LW+源码可运行.zip

    课设毕设基于SSM的系统源码可运行

    基于javaScript+python+Spark技术的气温预测+GUI图标显示+源码+文档(毕业设计&课程设计&项目开发)

    基于javaScript+python+Spark技术的气温预测+GUI图标显示+源码+文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用~ 基于javaScript+python+Spark技术的气温预测+GUI图标显示+源码+文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用~ 基于javaScript+python+Spark技术的气温预测+GUI图标显示+源码+文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用~ 项目简介: 天气预测网站,可通过生动直观的图表查看并对比历史天气; 并可自定义日程事件,网站将发送邮件提醒。

Global site tag (gtag.js) - Google Analytics