博客统计信息

用户名:ishira
文章数:12
评论数:4
访问量:21065
无忧币:20
博客积分:128
博客等级:2
注册日期:2008-11-12

我最近发表的评论

NUTCH配置初体验 回复
我是刚开始接触,试着做做,也不知..
2011-03-22 10:44:37
淘宝实习电面
主要是根据简历上的内容,先自己介绍一下现在的工作,你是怎么做的,会根据你的叙述问一些问题。
接下来根据你熟悉的内容问一些技术上的内容
String和StringBuffer的区别
const,static关键字
eclipse调试
linux命令
perl中数组和表
C++的HPL
总的来说都是根据你用过的东西 问一些技术细节
然后会问你有什么要问的
类别:未分类|阅读(76)|回复(0)|(0)阅读全文>>
2011-03-04 18:45:53
IDE:Perl.Builder.v2.0h.Professional-SSG
Task:
There is a collection of files og gene summaries. Each one has a relevant file which contains a list of sentemces which can be the candidate of summary sentence. I have ranked them with the method of LDA, TR and GO. Further more, I need weights to calculate the importance of sentence byall these three features.
files handle within a directory
loop through a file read each line of the file until bottom
put origin summary in a table..
类别:未分类|阅读(10)|回复(0)|(0)阅读全文>>
2011-02-17 11:53:32
Exception in thread "main" java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: NO) 
数据库密码错误
 
另外,连接JDBC数据库需下载mysql-connector-java-5.0.4-bin.jar(搭配mysql5.0)
类别:未分类|阅读(14)|回复(0)|(0)阅读全文>>
2010-12-14 15:09:06
出现错误:

Command 'ls' is available in '/bin/ls'

The command could not be located because '/bin' is not included in the PATH environment variable.

ls: command not found

原因是设置环境变量的时候写错了~

在设置的时候没有包含原路径
显示环境变量:

echo $PATH
里面没有/bin/
把它添加进去就就好了~~
类别:未分类|阅读(16)|回复(0)|(0)阅读全文>>
[\u4e00-\u9fa5]
经常用到,留作备忘
 
 
if(!(words[j].matches("[\u4e00-\u9fa5]")||words[j].matches("[a-z]+")))continue;//去掉非汉字和英文单词的情况
   
类别:未分类|阅读(184)|回复(0)|(0)阅读全文>>
2009-07-21 20:12:57
以前安装过一次
最近重装了电脑,不得不把这些再配一遍,感觉有点麻烦,所以在这里备忘
 
VE Runtime1.2.3  ->veruntime
VE SDK 1.2.3 ->ve
EMF 2.2 ->emf
GEF 3.2 ->gef
Eclipse 3.2(今天试了3.5,没有成功,不知道怎么回事,希望大家指点)
 
将四个插件分别解压到Eclipse文件夹下,将文件名改为->后的文件
例如 %eclipse%\ve\eclipse\..
然后在Eclipse文件夹下建立links文件夹
在文件夹中分别创建
ve.link
veruntime.link
emf.link
gef.link
每个文件夹中是对应的插件的路径如:
path=F://Pro..
类别:未分类|阅读(712)|回复(1)|(0)阅读全文>>
2009-05-05 09:50:00
英文标点符号验证


   英文标点符号比较多,如,(逗号)、.(点号)、?(问号)、:(冒号)、;(分号)、'(单引号)、!(感叹号)、"(双引号)、-(连接号)、--(破折号)、…(省略号)、()(小括号)、[](中括号)、{}(大括号)、`(所有格符号)等。以下正则表达式能够验证英文标点符号。
          [-,.?:;'"!`(){}\[\]]
[-,.?:;'"!`]|(-{2})|(\.{3})|(\(\))|(\[\])|({})               ..
类别:未分类|阅读(169)|回复(0)|(0)阅读全文>>
2009-04-04 15:29:13
哈工大中文分词工具包IRSplit:
要在一个JAVA工程中使用IRSplit,需要完成一下步骤:
1、将IRSplit.jar添加的java工程中
2、将data文件夹、IRdll.dll、IRLAS_config.ini拷贝到工程文件夹根目录下
3、将IRdll.dll拷贝到windows\system32目录下
这样就可以用哈工大中文分词包进行分词了
使用test.java测试分词效果IRLAS_config.ini可以设置一些参数
 
类别:未分类|阅读(192)|回复(0)|(0)阅读全文>>
2009-03-26 10:05:02
转自[url]http://hi.baidu.com/anlan187/blog/item/3a2f063d627cb0c29f3d62bb.html[/url]以备参考
以下工具绝大多数都是开源的,基于GPL、Apache等开源协议,使用时请仔细阅读各工具的license statement

I. Information Retrieval
1. Lemur/Indri
The Lemur Toolkit for Language Modeling and Information Retrieval
[url]http://www.lemurproject.org/[/url]
Indri:
Lemur's latest search engine

2. Lucene/Nutch
Apache Lucene is a high-performance, full-featured text search engine library written entirely in Java.
Lu..
类别:未分类|阅读(772)|回复(0)|(0)阅读全文>>
2008-12-30 13:08:53
nutch环境配置备忘:
1、Cygwin安装
    我使用的是Cygwin本地安装版,local install,并把所有组件都设为installed即可。
2、解压nutch
    将NUTCH-0.9解压后复制到HOME/Administrator下,或者在Cygwin下使用gunzip命令皆可。
3、安装JDK
    可能是我的系统最近不正常吧,我的JDK必须安装在nutch目录下才能找到(正确设置了环境变量,可是只要安装在其它位置,就找不到JDK,如果哪位能知道原因,请指教,非常感谢!)我这里的安装路径是:C:\cygwin\home\Administrator\nutch-0..
类别:未分类|阅读(9129)|回复(2)|(0)阅读全文>>
2008-12-01 15:56:31
通过今天的学习 有几个用到的变量和方法
 
一、INSTDIR & EXEDIR
INSTDIR是解压缩的路径,就是安装后释放的文件地址,即安装时设置的安装地址
EXEDIR指安装文件所在的文件夹,就是执行完.NSI生成的“INSTALL.EXE”的绝对路径。
 
二、About VIAddVersionKey
VIAddVersionKey使用之前似乎是必须先使用VIProductVersion来说明版本号。好像如果不加就会报错,我会再研究一下
VIAddversionKey的作用是“在文件属性的版本表格里添加一个字段”,通俗的说就是当右键单击生成的“INSTALL.EXE”查看属性时,“版本”选项..
类别:NSIS|阅读(282)|回复(0)|(0)阅读全文>>
2008-11-26 10:23:47
初学NSIS,试做了一个简单的安装程序,将一个编译好的.exe文件制成一个安装文件install.exe
以下是代码





; 这是一个简单的安装程序
 
;安装程序的名称,显示在安装程序的form上
Name  "安装程序例子"
 
;安装程序启动文件的名称
OutFile  "install.exe"
 
;默认安装目录,$PROGRAMFILES指示系统盘的Programm Files目录
InstallDir $PROGRAMFILES\sample\
;安装页面, 比如许可证说明页面等等
;license表示许可证页面,可以在里面添加许可信息
Page license
;directory表示选择安装目录的..
类别:未分类|阅读(207)|回复(1)|(0)阅读全文>>

我的技术圈(0)

更多>>