Linuxの認証ログをパースする
今回はsyslogのパースを取り上げました。syslogは典型的な半構造データで、意外と厄介な形式です。
正面から取り組む方法として正規表現を使う方法、裏口から取り組む方法としてElastic Stackにパースさせる方法を取り上げています。前者ではR 4.0から利用可能になったraw string形式を活用するのがポイント。後者では、前回少しだけ取り上げたhoist()関数を利用します。
今回はsyslogのパースを取り上げました。syslogは典型的な半構造データで、意外と厄介な形式です。
正面から取り組む方法として正規表現を使う方法、裏口から取り組む方法としてElastic Stackにパースさせる方法を取り上げています。前者ではR 4.0から利用可能になったraw string形式を活用するのがポイント。後者では、前回少しだけ取り上げたhoist()関数を利用します。