例では HTMLソース中のタイトル部分を取出す場合に前後の <TITLE> と </TITLE>
は
不必要で、その中のタイトル名だけ取出したい場合の説明です。
検索するパターンは下のように ( ) で囲っておくと、それを1つのグループとし、それぞれ
先頭から $1 、 $2 、 $3 ・・・ という変数で取出す事ができます。
今回は <TITLE> と </TITLE> の間にあるタイトル名のみ取出したいので、
$2 を取出して
使っています。
これは下のイメージにあるように、数が増えても $1 、 $2 、 $3 、 $4 、 $5
・・・・ と、それ
ぞれの場所に対応した変数で取出す事ができます。
下のサンプルソースでは、スクリプトと同じディレクトリに置かれている index.html
という
ファイルの内容を読み込み、タイトル名を取得して画面に表示します。
タイトル部分を示すパターンは (.*) を使っていますが、これはドットが任意の1文字を示し、
* が、それの 0回以上の繰り返しを示しますので、 1文字以上の任意の文字列があった
場合にマッチする書き方です。
タイトルがない場合、上記パターンにはマッチしませんので、その後の処理で
タイトルを
格納する変数に タイトル無し を格納しています。
また、スラッシュは式の中で区切り文字として使いますので、検索したいパターンに
スラッシュが入っている場合は \ を使ってエスケープしておきます。
|