`
zha_zi
  • 浏览: 584796 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论
文章列表
<body> <table width="100%" id="detailItem"> <tr><td align="center"><b>学历信息</b></td></tr> <table> <table cellspacing="1" cellpadding="1" border="1" width="100%" id=&q ...
<a href="javascript:PDF1.printWithDialog();">打印</a><hr>   <object  classid="clsid:CA8A9780-280D-11CF-A24D-444553540000" name="PDF1"   width="0"  height="0"  border="0">     <param  name="SRC"  value ...
nutch在使用中经常会修改url.txt中要抓取的目标网站,但是我们在二次开发的时候经常发现url但是仍然在抓取丢的配置网站,后来发现是索引文件夹得问题,在每次从新抓取的时候切忌要删掉索引文件夹,如果不删除目前我们发现会出现两个方面的问题 1:修改url从新抓取的时候不会根据新的url抓取,依然是抓取上次配置的url 2: 有时候会在抓取的执行到最后时候创建linked包错误,具体类型记得不是太清楚,大概就是linked xxxxx已经存在

判断汉字

判断一个字符是不是汉字 String strInput="xxxx" Character.UnicodeBlock.of(strInput) ==Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
   Nutch 默认只给用户提供一种是用方法就是用一个cygwin的模拟器去模拟一个 的环境,然后用户去用命令行在cygwin中执行搜索,还有 就是当开发者把nutch的源代码导入到eclipse的工程目录下然后执行 org.apache.nutch.crawl.Crawl类的main()这两种方法只是适合程序员做调试的时候手动开启,所以在二次开发nutch的时候就要把crawl放到在jsp中去调用, 步骤 1:新建一个web工程,把nutch源代码中plugins文件夹下的目录复制到src
长时间习惯于myeclipse部署tomcat竟然把最基本的手工部署方式给忘记了,几天又回忆了一下, 1、直接把项目web文件夹放在webapps里 2、修改conf里server.xml文件,添加一个Context, <Context path="/projectName" reloadable="true" docBase="工程所在路径\web" workdir="工程所在路径\work"></Context> 3、在Catalina/localhost目录里,新增一个xml文件,添 ...
现在eclipse下新建一个web工程,然后我把nutch-1.0.war解药后的文件全部复制到webroot下 启动tomcat 一直出现一个         严重: Exception sending context initialized event to listener instance of class org.apache.nutch.searcher.NutchBean$NutchBeanConstructor java.lang.IllegalArgumentException: plugin.folders is not defined          百 ...
如何跟换nutch1.0中文分词,我在网上基本把所有的办法都是试了一遍但是没有一个是可行的,真是怀疑这些人是纯转载别人的文章还是自己确实有试过, 这里把步骤详细给大家说一下下边是别人的文章,但是其中跟真实的情况有出入,我这里有所修改 前提nutch-1.0配置正常能正常的爬取   找到 src/java/org/apache/nutch/analysis/NutchAnalysis.jj 文件 line 130: | <SIGRAM: <CJK> > change to: | <SIGRAM: (<CJK>)+ > ...
     如何把整个nutch导入myeclipse 1:准备好nutch的源码开放包,我这里使用的nutch-0.9 2:file->new->java project->从已有的项目导入 然后选择你解压过的nutch文件夹   这事需要把conf文件夹修改成Default output folder 方法是右键properties -> java build path >source->  output floder 选择conf确定即可,   一般确定以后会把conf中以前的文件清空掉,在重新把nutch压缩包里的conf下的所有文件复 ...
  配置软件: 1、 Java jdk-1.6 1.1 下载安装 from: http://www.sun.com 安装目录:C:\Java\jdk1.6.0_03 1.2 修改环境变量 JAVA_HOME=C:\Java\jdk1.6.0_03\bin CLASSPATH=C:\Java\jdk1.6.0_03\lib\dt.jar;C:\Java\jdk1.6.0_03\lib\tools.jar 1.3 测试 java -version 2、tomcat-6.0 2.1 下载 ...
   我们不得不面对操蛋的人生,项目也是这样, 这用jbpm的时候遇到了一个<task-node>下边手动的产生多个task的问题,去实现一个汇签的功能, 但是无论是按照网上的教程,还是视频的都无法执行到直接定义的类,整整困扰了我2天,太悲剧了, 大家如果遇到这样的问题 试一下吧jar文件更换一下。    我的就是这样解决的。
        在使用jbpm的时候创建task 有两种方式,一直是有jbpm给我创建,还有一种是自己根据业务需求手动创建task 而且手动创建时一种非常常见的方式,例如在处理工作流中的汇签问题,      查询资料上提到手动创建task的步骤  把create-tasks="false" ,在event 事件上边配置要触发的时间类型 以及要触发的class   <?xml version="1.0" encoding="GBK"?> <process-definition xmlns="urn:j ...
     最近在学新jbpm开源工作流,学习过程非常不顺利,版本太复杂,乱七八糟 把按照教程上的说明把4.2的jar包拷进去 做了一个最贱单的例子死活就是 不能运行,发现网上大部分的教程都是3.2,没办法换了一个开发包,发现连个开发包里边的东西名字和分类都不是太一样,仍旧是那个最简单的例子还是不能运行     抛出一个org.hibernate.cache.NoCachingEnabledException: Second-level cache is not enabled for usage [hibernate.cache.use_second_level_cache | hibern ...
   闲来无事在网上找了一个jquery的grid插件 flexgird, 看了看大概的效果感觉挺喜欢的,想在自己的项目中使用一下,就在bolg上搜索了几篇关于flexgird的文章,按照文章上的说明一步一步来但是就是没法出来table页面上面一片空白 ,感觉很奇怪,是不是那里有问题?    最后发现在下载的压缩包里有例子,例子就在解压后的flexigrid文件夹中的index.html 这里面有各种样式的table以及使用代码 哈哈 这下不用迷茫了,随便吧例子中的代码粘贴过来 立马效果就出现了 现在我把执行通过的页面代码奉上 <%@ page language=" ...
    第一次用weblogic 出现了一个很奇怪的问题,按照说明去一步一步配置,部署,结果始终无法部署成功弄了 一直在报 WebLogicDeployableObject' may not be null 错误 实在是不知道怎么回事没有人指导,百度不出来,搞了半天结果是web.xml 的编码问题,   实在是郁闷啊
Global site tag (gtag.js) - Google Analytics