定期的に更新されるファイルを取り込む

日次や毎時で更新されるファイルを取り込む場合は以下の内容をご参照ください。

同一ファイル名で定期更新されるファイルの場合

Rtoaster insight+のファイル取り込みは、ジョブで設定した入力元のファイルパスに該当するファイルのうち、前回ジョブ実行以降に更新されたファイルのみ取り込む仕様となっています。

そのため、同じファイル名で定期的に更新されるファイルを取り込む場合には、ファイル更新のタイミングに合わせたスケジュールをジョブで設定してください。

■ ジョブの設定例

【毎日午前10時に更新されるファイル(bucket1/hoge/sample1.csv)を取り込む】

上記の設定例では、午前10時にファイルが更新されるため、Rtoaster insight+への取り込みジョブは午前11時に実行されるように設定しています。

日付や連番等の情報を含んだファイル名の場合

たとえば日時情報等のように、更新される毎にファイル名が変わる場合はファイルパスに正規表現を利用します。

正規表現を利用することで連番で更新されるファイルなど、複数のファイルを一度に取り込むことも可能です。
なお、取り込み対象が複数になった場合でも、前回ジョブ実行以降に更新されたファイルのみ取り込む仕様が適用されます。

■ ジョブの設定例

【毎日午前10時に更新されるファイル(bucket1/hoge/sample_[YYYY_MM_DD_hh_mm].csv)を取り込む】

  • 入力元設定
    • バケット:bucket1
    • ファイルパス(CSVのみ対応):hoge/sample_\d{4}_\d{2}_\d{2}_\d{2}_\d{2}.csv
    • 『正規表現を使用する』にチェック
  • 実行スケジュール設定
    • スケジュール(cron形式):0 11 * * *

上記の設定例では、午前10時にファイルが更新されるため、Rtoaster insight+への取り込みジョブは午前11時に実行されるように設定しています。

■ その他正規表現の例

  • ファイル名:bucket1/hoge/sample_YYYYMMDD.csvの場合の入力元設定
    • バケット:bucket1
    • ファイルパス(CSVのみ対応):hoge/sample_\d{8}.csv
    • 『正規表現を使用する』にチェック
  • ファイル名:bucket1/hoge/sample_n.csvの場合の入力元設定
    • バケット:bucket1
    • ファイルパス(CSVのみ対応):hoge/sample_\d.csv
    • 『正規表現を使用する』にチェック

《初回実行時について》

  • 初回取り込み時は、正規表現にマッチするファイルが全て取り込まれることとなります。
  • 前回実⾏以降に更新されたファイルのみ対象とする挙動は、2回⽬実⾏以降となります。