前面幾個問題都承蒙「twtw」與「fillano」的解答。
延續這樣的問題,在諸多文字資料中,因為文字都是經OCR文字辨識的緣故,某些字特別無法辨識,我希望將「築刻」與「蒙刻」替代成「篆刻」。但不希望「雕刻」也被替代。如此EmEditor應該如何下達指令呢?
雕刻
築刻
蒙刻
篆刻學
小篆文字
另外--------------------
也需要把很多關於「尺讀」,「尺賣」等奇怪的辨識文字,改成「尺牘」
應該如何下達指令?
謝謝!
fillano提到:
也是,其實用RE還是做得到,
用Perl寫的,為了要方便理解,沒用迴圈,單純拷貝貼上改一改而已。
<pre class="c" name="code">
#!/usr/bin/perl -w
$var="雕刻\n築刻\n蒙刻\n篆刻學\n小篆文字\n尺讀\n尺賣";
#篆刻->篆刻
print "[篆刻->篆刻]取代前:\n$var\n";
$var =~ s/築刻/篆刻/g;
print "[篆刻->篆刻]取代後:\n$var\n";
#蒙刻->篆刻
print "[蒙刻->篆刻]取代前:\n$var\n";
$var =~ s/蒙刻/篆刻/g;
print "[蒙刻->篆刻]取代後:\n$var\n";
#尺讀->尺牘
print "[尺讀->尺牘]取代前:\n$var\n";
$var =~ s/尺讀/尺牘/g;
print "[尺讀->尺牘]取代後:\n$var\n";
#尺賣->尺牘
print "[尺賣->尺牘]取代前:\n$var\n";
$var =~ s/尺賣/尺牘/g;
print "[尺賣->尺牘]取代後:\n$var\n";
利用有支援 regular expression 的 PCRE 或是 perl 來搜尋並取代特定的 token