NLP関係のメモ 内容は保証できません。 * swig installation ** install swig wget http://www.desilinguist.org/software/swig-srilm.tar.gz tar xf swig-srilm.tar.gz # # download and install PCRE # # configuring swig ./configure --prefix=/now16/mnakajima --with-pcre-prefix=/now16/mnakajima/root make make check make install * srilm with swig tar xf swig-srilm.tar.gz cd swig-srilm cp srilm_perl.i srilm_ruby.i mv srilm.c srilm.cpp # srilm.cpp の末尾に Boolean _Map::foundP = false; を付け足す (dstructure/Map.ccがリンクされない(?)ため、その分、こっちに書く) # unsigned Debug::debugAll = 0; も追加 (misc/debug ./Debug.cc:の分 ) rvm use 1.9.2 # (rvm使ってるなら) ruby extconf.rb ln -s ../../root/local/srilm-1.6.0/lib/i686-m64/ lib make now16/mnakajima/src/srilm/dstruct/src/BlockMalloc.cを -fPIC -c でコンパイルし、Makefileと同じ位置にmv MStringTokUtil.oも。 srilm.soを作るg++コマンドをコピペし、lib/ilb* BlockMalloc.o を付け足して再実行 make install * install SRILM in Mac OS X 10.6 mkdir srilm mv srilm-1.6.0.tgz srilm cd srilm tar xf srilm-1.6.0.tgz make SRILM=`pwd` TCL_INCLUDE="" TCL_LIBRARY="" NO_TCL=X MACHINE_TYPE=macosx-m64 * SRILMつかいかた # N-gramを作る /local/srilm-1.5.10/bin/i686-m64/ngram-count -order 10 -interpolate -wbdiscount -text source.txt -lm model.lm # ppl計算 /local/srilm-1.5.10/bin/i686-m64/ngram -order 10 -lm model.lm -ppl input.txt -debug 1 * vim ./configure * vim ./configure --prefix=/now16/mnakajima/root --with-features=huge --enable-multibyte --enable-fontset