在开始构建我们的搜索引擎之前,你必须先做好以下步骤:
1.
确认你的JDK版本在5.0以上;
2.
将hibernate跟log4j的配置文件复制到你的类目录下;
3.
复制jbox配置文件跟"DICT"文件夹到你的应用程序目录;
你的目录树的结构可能如下:
4.如下面所示设置jbox配置文件:
<spider class =
"org.jbox.spider.htmlSpider.SimpleSpider">
<maxPageNume>10</maxPageNum>
<startUrls>
<property name =
"URL">http://localhost</property>
</startUrls>
<crawlRules>
<property name = "Rule">http://.*</property>
</crawlRules>
</spider>
更多关于配置文件的信息看这里。
5.hibernate的设置由你的数据库决定。确定你已经创建表"Page"跟"Word"。你可以在SQL包内的"MYSQL.txt"中找到数据库的创建语句(MySql)。
如果你已经完成了以上步骤,点击 这里开始构建我们的搜索引擎。