気が向いたのでYouTubeチャンネルの気に入った音声放送の文字書き起こしをしました。
すこしずつコマ送り気味に音声を繰り返し聞いてキー入力する地道な作業です。
入力しつつ、発言者の人名を入れて行くのは面倒ですので、あとで一括変換するつもりで、
適当な記号を入れてありました。
全部入力し終わったあと、Jedit正規表現で検索置換をしようとしたところ置換が出来ません。
一時間分の放送がありますから文章としても相当のながさです。
──────────正規表現
明治十年一月二日、大正12年01月二日、昭和12年04月一日などの元号漢数字アラビア数字
混じりの表示を例えば2016/01/01などと検索置換する為の式です。
プラスとアスタリスクのスペシャルキャラクターを使ってしまったというミスでした。
正規表現のうちスペシャルキャラクターは特別の働きをしますから、単なる文字記号ではありません。
うーん、これは困りました。
記憶をたどって、スペシャルキャラクターを普通の記号と変換するため、カギカッコ[]で区切り、
マッチする回数で置換して文章を置き換えました。
この正規表現は文章を頻繁に扱う職のかたには強い味方になるかと思います。
アスタリスク記号の置き換え
プラス記号の置き換え
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー