dfirr

A Note on R How-to in Cybersecurity Investigation

import

アドホックなログをSplunkに転送する

情報セキュリティ関連業務にはログ分析が付き物であるものの、当該ログが最初からログ基盤に入っているとはかぎりません。システム担当者からログを圧縮ファイルとして受け取ることも多々あります。 そのログをいきなりRで読むのも一興ですが、一度Splunkに…

MSTICPyでSplunkからデータを取り込む

SplunkにはRest APIがあるので、RからAPIを叩いてデータを取得することができます。しかしRate Limitなど、考慮しなくてはいけない事項があります。SplunkにはPython SDKがありますがR用のSDKはないので、このあたりを手作業で解決しなければいけません。面…

フィッシングサイトの週次集計グラフを作る

今回は、特定の技法にテーマを絞っていない番外編です。2023年7月15日にISACA名古屋支部のSR分科会にお邪魔したので、そのとき出題されたお題をRで解いた例を示します。tidyverseの特徴が出やすい問題だったからです。 お題は、JPCERT/CCのフィッシングサイ…

Linuxの認証ログをパースする

今回はsyslogのパースを取り上げました。syslogは典型的な半構造データで、意外と厄介な形式です。 正面から取り組む方法として正規表現を使う方法、裏口から取り組む方法としてElastic Stackにパースさせる方法を取り上げています。前者ではR 4.0から利用可…

JSONデータを矩形化する

今回はJSONに代表される入れ子構造のリストを矩形化する方法を取り上げました。Rにおける入れ子構造の取り扱いは統計モデルが例に挙がることがほとんどなのですが、情報セキュリティ屋が対峙するケースとしては、情報提供サービスからREST APIで取得したJSON…

スクリプトに認証情報を埋め込まないようにする

データレイクや各種情報サービスなどからWeb APIを使ってデータを取得することは珍しくありません。たとえばSplunkからデータを取得する方法としては、同社のブログ「Leveraging External Data Science Stacks with Splunk Today」(2019-03-18)が参考にな…

Squidログを取り込む

今回はSquidプロキシのログを取り込む方法を取り上げました。CRANにはwebreadrというパッケージがあり、Squidログが読み込めることが謳われているのですが、mime_typeフィールドが未定義のため、実際にはエラーが生じるケースが多いと思います。Squidのログ…