文章結構 html text由好多行構成
<p>aragraph1 in one line入面無任何分號</p>
<p>aragraph2 in one line入面無任何分號</p>
<p>aragraph2 in one line入面無任何分號</p>
<p>aragraph 有兩種</p>
第一種 入面無eakline<p>aragraph 入面無<br/>eakline </p>
第二種 入面有多個eaklines
<p>aragraph
<br/>eakline1
<br/>eakline2
<br/>eakline3
</p>
第一種 後面加分號<p>aragraph 入面無<br/>eakline</p>;
第二種 係第一個 eakline 前面加分號
<p>aragraph
; <br/>eakline1 /*係第一個 <br/>eakline 前面加分號*/
<br/>eakline2
<br/>eakline2
</p>
第一個問題 第一個 eakline 前面加分號
我用這句 regex 查不到^((?<!<br class="calibre1"/>).+)+(?=<br class="calibre1"/>\$)
註解
^ /*每行起始*/
(
(?<!<br class="calibre1"/>).+ /*前面無<br>eakline的字串*/
)+
(?=<br class="calibre1"/>\$)
第二個問題後面加分號
我用這句 regex 又失敗 要命^( (?<!;).+)+(?=</p>$)
註解
^ /*每行起始*/
(
(?<!;).+ /*前面無分號的字串*/
)+(?= </p>$)