- 浏览: 286706 次
- 性别:
- 来自: 广州
最新评论
-
lliiqiang:
关键在于业务也正确,数据格式只是一种声明协议
XML验证 -
koubi1986:
你好!请教一些问题:请问一下1。你是如何把nutch抓取到的二 ...
Nutch应用 -
juda:
你的希尔排序有问题, for( int i = d; i & ...
排序--插入排序 -
hamlzf:
这个例子很不错
JProfiler学习笔记 -
白色熊猫:
应该下面还有啊 ,看不到啊 麻烦贴出来下 谢谢了
多线程编程 高级主题(二)注:转
文章列表
随着计算机技术的日益普及,Internet/Intranet技术得到了更加广泛的应用,在世
界范围的大量Web网点上以及公司内部的Web服务器上,都存放着大量的信息。为使这些信
息得到的合理使用,Web服务器管理员应该为用户提供方便的信息检索方法。作为群件代
表的Lotus Domino
4.5集成了邮件处理、群件应用和Internet出版等功能,是Notes技术向Internet/
Intranet融合开放的里程碑式的产品。在继承以往产品全部优点与功能的基础上,Domino
将原先的Notes服务器提升为用途更广泛、使用更方便的Internet/Intranet服务器。在
Dom ...
- 2007-05-29 17:50
- 浏览 1414
- 评论(0)
莲花(Lotus)公司的群件产品Lotus Domino/Notes 自推出之后,备受大家的关注和关爱。经过不断的发展、不断成熟,目前其最新版本4.6x已是一个相当可靠、稳定、友好、健壮的系统。
Domino/Notes是一套以邮件为基础的数据库平台,其 ...
- 2007-05-29 17:40
- 浏览 1655
- 评论(0)
CAS (Central Authentication Service)是Yale大学的ITS开发的一套JAVA实现的开源
的SSO(single sign-on)的服务。
这里用一个简单的例子来说明用CAS来实现单点登陆(SSO)。
Yale CAS Server 的配置过程
CAS (Central Authentication Service)是Yale大学的ITS开发的一套JAVA实现的开源
的SSO(single sign-on)的服务。该服务是以一个java web app(eg:cas.war)来进行服务的,
使用时需要将cas.war发布到一个servlet2.3兼容的服务器上, ...
- 2007-05-21 13:04
- 浏览 5824
- 评论(3)
美国Lotus公司(已被IBM公司兼并)于八十年代后期推出的群组工作软件(群件)——Lotus Notes/Domino是一种基于Internet/Intranet技术为构架的群件系统,运行模式不但有客户机/服务器(Client/Server),而且有浏览器/服务器(Browser/Ser ...
- 2007-05-21 13:03
- 浏览 2326
- 评论(0)
Java中文问题一直困扰着很多初学者,如果了解了Java系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之道。
最古老的解决方案是使用String的字节码转换,这种方案问题是不方便,我们需要破坏对象封装性, ...
- 2007-05-21 13:02
- 浏览 1045
- 评论(0)
“你不必严格遵守这些原则,违背它们也不会被处以宗教刑罚。但你应当把这些原则看成警铃,若违背了其中的一条,那么警铃就会响起。”
----------Arthur J.Riel
(1)所有数据都应该隐藏在所在的类的内部。
(2)类的使用者必须依赖 ...
- 2007-05-21 11:12
- 浏览 1158
- 评论(0)
1、Oracle8/8i/9i数据库(thin模式)
Class.forName("oracle.jdbc.driver.OracleDriver").newInstance();
String url="jdbc:oracle:thin:@localhost:1521:orcl";
//orcl为数据库的SID
String user="test";
String password="test";
Connection conn= DriverManager.getConnection(url,use ...
- 2007-05-21 11:10
- 浏览 1399
- 评论(0)
垂直搜索引擎技术
一、互联网信息采集与处理检索系统
1. 新闻搜索引擎SPIDER
2. 网页搜索引擎SPIDER
3. 定向专业搜索SPIDER
4. 基于视觉的正文智能提取模块(自动正文提取)
5. 智能摘要提取模块
6. 去重模块
7. 智能分类模块
8. 检索前端类聚模块
9. 分词模块
10. 索引模块
11. 最大可支持10TB以上数据容量,可分层建索引库、分布索引、分布检索、分布采集处理。
二、WEB结构化信息抽取技术(格式化数据 ...
- 2007-05-21 11:00
- 浏览 2187
- 评论(1)
Nutch作为一款刚刚诞生的开源Web搜索引擎,提供了除商业搜索引擎外的一种新的选择。个人、企业都可通过Nutch来构建适合于自身需要的搜索引擎平台,提供适合于自身的搜索服务,而不必完全被动接收商业搜索引擎的各种约束。
Nutch的工作流程可以分为两个大的部分:抓取部分与搜索部分。抓取程序抓取页面并把抓取回来的数据进行反向索引,搜索程序则对反向索引进行搜索回答用户的请求,索引是联系这两者的纽带。图1是对Nutch整个工作流程的描述。
首先需要建立一个空的URL数据库,并且把起始根urls添加到URL数据库中(步骤1),依据URL数据库在新创建的segment中生成fetchlist,存放了 ...
- 2007-05-21 10:57
- 浏览 4800
- 评论(1)
搜索引擎学习资源收集
一、搜索引擎技术/动态资源
<一>、综合类
1、卢亮的搜索引擎研究 http://www.wespoke.com/
卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。
2、laolu'blog
有不少来自国外的关于搜索引擎方面的资料,偏重于资料和数字
3、哈斯日志 http://www.loverty.org/
在这里可以看到国内外几大搜索引擎的最新动 ...
- 2007-05-21 10:42
- 浏览 10861
- 评论(1)
原文地址:http://blog.csdn.net/calvinxiu/archive/2007/02/09/1506112.aspx
Hadoop 是Google MapReduce
的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑 ...
- 2007-05-21 10:09
- 浏览 48472
- 评论(3)
1 互联网搜索
其实搜索的这个核心就是分词与PageRank算法,择日和大家讨论具体的实现,依靠PR算法,sogou 3.0的搜索结果相当不错,如果融入人工智能、数据挖掘自然语言理解等最新信息技术成果的搜索引擎,将会给用户带来了一 ...
http://lucene.apache.org/nutch/tutorial8.html
有如下的介绍:
Requirements
Java 1.4.x, either from Sun
or IBM
on Linux is preferred. Set NUTCH_JAVA_HOME
to the root of your JVM installation.
Apache's Tomcat
4.x.
On Win32, cygwin
, for shell support. (If you plan to use Subversion on Wi ...
- 2007-05-15 17:28
- 浏览 6763
- 评论(1)
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下:
0)设有两篇文章1和2
文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too.
文章2的内容为:He once lived in Shanghai.
1)由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章的关键词,通常我们需要如下处理措施
a.我们现在有的是文章内容,即一个字符串,我们先要找出字符串中的所有单词,即分词。英文单词由于用空格分隔,比较好处理。中文单词间是连在一起的需要特殊的 ...
- 2007-04-25 17:20
- 浏览 4661
- 评论(4)
请问用hibernate注解能映射自身的一对多关系吗?比如说要实现“organization(组织机构)”的自身的一对多关系的映射,方便地话请给出关键的配置代码,先谢了!