淘宝实习电面
主要是根据简历上的内容,先自己介绍一下现在的工作,你是怎么做的,会根据你的叙述问一些问题。
接下来根据你熟悉的内容问一些技术上的内容
String和StringBuffer的区别
const,static关键字
eclipse调试
linux命令
perl中数组和表
C++的HPL
总的来说都是根据你用过的东西 问一些技术细节
然后会问你有什么要问的
IDE:Perl.Builder.v2.0h.Professional-SSG
Task:
There is a collection of files og gene summaries. Each one has a relevant file which contains a list of sentemces which can be the candidate of summary sentence. I have ranked them with the method of LDA, TR and GO. Further more, I need weights to calculate the importance of sentence byall these three features.
files handle within a directory
loop through a file read each line of the file until bottom
put origin summary in a table..
Exception in thread "main" java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: NO)
数据库密码错误
另外,连接JDBC数据库需下载mysql-connector-java-5.0.4-bin.jar(搭配mysql5.0)
出现错误:
Command 'ls' is available in '/bin/ls'
The command could not be located because '/bin' is not included in the PATH environment variable.
ls: command not found
原因是设置环境变量的时候写错了~
在设置的时候没有包含原路径
显示环境变量:
echo $PATH
里面没有/bin/
把它添加进去就就好了~~
[\u4e00-\u9fa5]
经常用到,留作备忘
if(!(words[j].matches("[\u4e00-\u9fa5]")||words[j].matches("[a-z]+")))continue;//去掉非汉字和英文单词的情况
以前安装过一次
最近重装了电脑,不得不把这些再配一遍,感觉有点麻烦,所以在这里备忘
VE Runtime1.2.3 ->veruntime
VE SDK 1.2.3 ->ve
EMF 2.2 ->emf
GEF 3.2 ->gef
Eclipse 3.2(今天试了3.5,没有成功,不知道怎么回事,希望大家指点)
将四个插件分别解压到Eclipse文件夹下,将文件名改为->后的文件
例如 %eclipse%\ve\eclipse\..
然后在Eclipse文件夹下建立links文件夹
在文件夹中分别创建
ve.link
veruntime.link
emf.link
gef.link
每个文件夹中是对应的插件的路径如:
path=F://Pro..
英文标点符号验证
英文标点符号比较多,如,(逗号)、.(点号)、?(问号)、:(冒号)、;(分号)、'(单引号)、!(感叹号)、"(双引号)、-(连接号)、--(破折号)、…(省略号)、()(小括号)、[](中括号)、{}(大括号)、`(所有格符号)等。以下正则表达式能够验证英文标点符号。
[-,.?:;'"!`(){}\[\]]
[-,.?:;'"!`]|(-{2})|(\.{3})|(\(\))|(\[\])|({}) ..
哈工大中文分词工具包IRSplit:
要在一个JAVA工程中使用IRSplit,需要完成一下步骤:
1、将IRSplit.jar添加的java工程中
2、将data文件夹、IRdll.dll、IRLAS_config.ini拷贝到工程文件夹根目录下
3、将IRdll.dll拷贝到windows\system32目录下
这样就可以用哈工大中文分词包进行分词了
使用test.java测试分词效果IRLAS_config.ini可以设置一些参数
转自[url]http://hi.baidu.com/anlan187/blog/item/3a2f063d627cb0c29f3d62bb.html[/url]以备参考
以下工具绝大多数都是开源的,基于GPL、Apache等开源协议,使用时请仔细阅读各工具的license statement
I. Information Retrieval
1. Lemur/Indri
The Lemur Toolkit for Language Modeling and Information Retrieval
[url]http://www.lemurproject.org/[/url]
Indri:
Lemur's latest search engine
2. Lucene/Nutch
Apache Lucene is a high-performance, full-featured text search engine library written entirely in Java.
Lu..
nutch环境配置备忘:
1、Cygwin安装
我使用的是Cygwin本地安装版,local install,并把所有组件都设为installed即可。
2、解压nutch
将NUTCH-0.9解压后复制到HOME/Administrator下,或者在Cygwin下使用gunzip命令皆可。
3、安装JDK
可能是我的系统最近不正常吧,我的JDK必须安装在nutch目录下才能找到(正确设置了环境变量,可是只要安装在其它位置,就找不到JDK,如果哪位能知道原因,请指教,非常感谢!)我这里的安装路径是:C:\cygwin\home\Administrator\nutch-0..
通过今天的学习 有几个用到的变量和方法
一、INSTDIR & EXEDIR
INSTDIR是解压缩的路径,就是安装后释放的文件地址,即安装时设置的安装地址
EXEDIR指安装文件所在的文件夹,就是执行完.NSI生成的“INSTALL.EXE”的绝对路径。
二、About VIAddVersionKey
VIAddVersionKey使用之前似乎是必须先使用VIProductVersion来说明版本号。好像如果不加就会报错,我会再研究一下
VIAddversionKey的作用是“在文件属性的版本表格里添加一个字段”,通俗的说就是当右键单击生成的“INSTALL.EXE”查看属性时,“版本”选项..
初学NSIS,试做了一个简单的安装程序,将一个编译好的.exe文件制成一个安装文件install.exe
以下是代码
; 这是一个简单的安装程序
;安装程序的名称,显示在安装程序的form上
Name "安装程序例子"
;安装程序启动文件的名称
OutFile "install.exe"
;默认安装目录,$PROGRAMFILES指示系统盘的Programm Files目录
InstallDir $PROGRAMFILES\sample\
;安装页面, 比如许可证说明页面等等
;license表示许可证页面,可以在里面添加许可信息
Page license
;directory表示选择安装目录的..