「S3」タグの記事が5件件あります

項目	選択	説明
作成方法	設計図の使用
設計図	kinesis-firehose-cloudwatch-logs-processor	Node.js版。Python2.7版のkinesis-firehose-cloudwatch-logs-processor-pythonもあります
関数名	kinesis-firehose-cloudwatch-logs-processor	任意
実行ロール	基本的なLambdaアクセス権限で新しいロールを作成する

ソース中にコメントに以下の記載があり、どのような形式のログが渡ってくるかがわかります。

/*
For processing data sent to Firehose by Cloudwatch Logs subscription filters.

Cloudwatch Logs sends to Firehose records that look like this:

{
  "messageType": "DATA_MESSAGE",
  "owner": "123456789012",
  "logGroup": "log_group_name",
  "logStream": "log_stream_name",
  "subscriptionFilters": [
    "subscription_filter_name"
  ],
  "logEvents": [
    {
      "id": "01234567890123456789012345678901234567890123456789012345",
      "timestamp": 1510109208016,
      "message": "log message 1"
    },
    {
      "id": "01234567890123456789012345678901234567890123456789012345",
      "timestamp": 1510109208017,
      "message": "log message 2"
    }
    ...
  ]
}

The data is additionally compressed with GZIP.

The code below will:

1) Gunzip the data
2) Parse the json
3) Set the result to ProcessingFailed for any record whose messageType is not DATA_MESSAGE, thus redirecting them to the
   processing error output. Such records do not contain any log events. You can modify the code to set the result to
   Dropped instead to get rid of these records completely.
4) For records whose messageType is DATA_MESSAGE, extract the individual log events from the logEvents field, and pass
   each one to the transformLogEvent method. You can modify the transformLogEvent method to perform custom
   transformations on the log events.
5) Concatenate the result from (4) together and set the result as the data of the record returned to Firehose. Note that
   this step will not add any delimiters. Delimiters should be appended by the logic within the transformLogEvent
   method.
6) Any additional records which exceed 6MB will be re-ingested back into Firehose.
*/

処理手順も色々ありそうですが、そのあたりはすでに実装済みなので、変換する形式を変更したい場合はtransformLogEvent関数を修正するだけです。設計図での実装は、付加情報は全部除外して、ログのメッセージに改行を付与して出力しています。

/**
 * logEvent has this format:
 *
 * {
 *   "id": "01234567890123456789012345678901234567890123456789012345",
 *   "timestamp": 1510109208016,
 *   "message": "log message 1"
 * }
 *
 * The default implementation below just extracts the message and appends a newline to it.
 *
 * The result must be returned in a Promise.
 */
function transformLogEvent(logEvent) {
    return Promise.resolve(`${logEvent.message}\n`);
}

例えば、logEventの内容をすべて出力し改行を付与する場合は、以下の様になると思います。

function transformLogEvent(logEvent) {
    return Promise.resolve(`${JSON.stringify(logEvent)}\n`);
}

また、Amazon Kinesis Data Firehose CloudWatch Logs Processorというテストイベントも用意されているので、マネジメントコンソールで簡単にテストができます。

最後に、Lambdaのタイムアウトを1分以上にしておきましょう。

Kinesis Data Firehoseのストリームを作成

マネジメントコンソールで作成します。

項目	選択	説明
Delivery stream name	CloudWatchLogs-to-S3	任意
*Choose a source*
source	Direct PUT or other sources
*---次のページ---*
*Transform source records with AWS Lambda*
Record transformation	Enabled
Lambda function	kinesis-firehose-cloudwatch-logs-processor	作成したLambda
Lambda function version	$LATEST
*Convert record format*
Record format conversion	Disabled
*---次のページ---*
*Select a destination*
Destination	Amazon S3
*S3 destination*
S3 destination	log-backup-xxxxx	作成したバケット
S3 prefix	logs/
S3 error prefix	error/
*S3 backup*
Source record S3 backup	Disabled
*S3 buffer conditions*
Buffer size	5MB	デフォルト値
Buffer interval	300seconds	デフォルト値
*S3 compression and encryption*
S3 compression	Disabled
S3 encryption	Disabled
*Error logging*
Error logging	Enabled
*Permissions*
IAM role	Create new or choose	新しくIAMロールを作成するといい感じにアクセス権限を付与してくれます

CloudWatch Logsに付与するIAMロールを作成

このあとの手順で作成するCloudWatch Logsのサブスクリプションフィルターに、Firehoseにアクセスする権限が必要なので、IAMロールを作成します。ただ、マネジメントコンソール上からは、CloudWatch Logsに付与するIAMロールはそのままでは作れないので、以下の手順で作成します。

まずはマネジメントコンソールでIAMロールを作成します。

項目	選択	説明
信頼されたエンティティの種類を選択	AWSサービス
このロールを使用するサービスを選択	EC2
Attach アクセス権限ポリシー	なし	次の手順で付与します
ロール名	CWLtoKinesisFirehoseRole
ロールの説明	削除	説明がEC2になってるので削除しておく

次にIAMポリシーを作成します。

項目	選択	説明
*サービス1*
サービス	Firehose
アクション	すべてのFirehoseアクション
リソース	arn:aws:firehose:ap-northeast-1:[アカウントID]:deliverystream/CloudWatchLogs-to-S3	作成したFirehoseの配信ストリームのARN
*サービス2*
サービス	IAM
アクション	PassRole
リソース	arn:aws:iam::[アカウントID]:role/CWLtoKinesisFirehoseRole	作成したIAMロールのARN
*---次のページ---*

| ポリシーの確認 | 名前 | Permissions-Policy-For-CWL |

再度IAMロールの編集画面に戻り、CWLtoKinesisFirehoseRoleロールにPermissions-Policy-For-CWLポリシーをアタッチします。

最後にCWLtoKinesisFirehoseRoleロールの信頼関係タブの信頼関係の編集をクリック。"Service": "ec2.amazonaws.com"の部分を"Service": "logs.ap-northeast-1.amazonaws.com"に変更し、保存します。

CloudWatch Logsサブスクリプションフィルターの作成

マネジメントコンソールからは作成できないようですので、CLIで作成します。

パラメータ(キー)	パラメータ(値)	説明
--log-group-name	/aws/lambda/xxxxxx	サブスクリプションフィルターを追加したいロググループ名
--filter-name	Logs-to-Firehose	任意
--filter-pattern	""	フィルターせず、全ての場合
--destination-arn	arn:aws:firehose:ap-northeast-1:[アカウントID]:deliverystream/CloudWatchLogs-to-S3	作成したFirehoseの配信ストリームのARN
--role-arn	arn:aws:iam::[アカウントID]:role/CWLtoKinesisFirehoseRole	作成したIAMロールのARN

aws logs put-subscription-filter --log-group-name [ロググループ名] --filter-name Logs-to-Firehose --filter-pattern "" --destination-arn arn:aws:firehose:ap-northeast-1:[アカウントID]:deliverystream/CloudWatchLogs-to-S3 --role-arn arn:aws:iam::[アカウントID]:role/CWLtoKinesisFirehoseRole

完成

これで無事にS3にCloudWatchLogsがS3に保存されます。 GlueやAthenaでもクエリーがかけられそうです。

参考

https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/logs/SubscriptionFilters.html#FirehoseExample https://docs.aws.amazon.com/ja_jp/firehose/latest/dev/data-transformation.html https://docs.aws.amazon.com/cli/latest/reference/logs/put-subscription-filter.html

S3にPutObjectするPythonプログラムをFargateに乗せるまでの道のり

2019年7月6日 · 約5分

moritalous

Maintainer of this blog

お知らせ

過去にQiitaに投稿した内容のアーカイブです。

簡単なPythonプログラムをFargateで実行するまでの道のりです。

app.py
import os

import boto3

bucket = os.getenv('BUCKET_NAME', '')
key = 'HelloWorld.txt'
body = 'Hello, World!'

s3 = boto3.client('s3')
s3.put_object(Bucket=bucket, Key=key, Body=body)

環境変数で渡したバケットに固定文字列のファイルを出力するだけです。

試した環境は

Windows環境で実行
Docker環境で実行
Fargate環境で実行（1回だけ実行）
Fargate環境で実行（定期実行）

7/7 更新 S3エンドポイントは不要でしたので記述を削除しました。

Windows環境で実行

環境

Windows 10
Python 3.6

Python仮想環境の作成

python -m venv .venv
.venv\Scripts\activate

ライブラリーの取得

pip install boto3 awscli

AWS CLIの設定(認証情報の設定)

aws configure
AWS Access Key ID [None]: [アクセスキー]
AWS Secret Access Key [None]: [シークレットアクセスキー]
Default region name [None]: [ap-northeast-1などのリージョン]
Default output format [None]:

バケット名の指定（環境変数）

バケット名は環境変数から取得するようにしたので、環境変数にバケット名をセットします

set BUCKET_NAME=[バケット名]

実行！

python -m app

無事、S3にファイルが出力されました。

Docker環境で実行

ファイルの用意

requirements.txtとDockerfileを用意し、app.pyと同じフォルダーに格納します。

requirements.txt

boto3==1.9.183

Dockerfile
FROM python:alpine

WORKDIR /app
ADD . /app

RUN python3 -m pip install -r requirements.txt
CMD ["python3", "-m", "app"]

Dockerイメージのビルド

docker build -t [Dockerイメージのタグ名] .

実行！！

コンテナ内にはAWSの認証情報がないので、環境変数で渡します。バケット名も同様です。

docker run -e AWS_ACCESS_KEY_ID=[アクセスキー] -e AWS_SECRET_ACCESS_KEY=[シークレットアクセスキー] -e BUCKET_NAME=[バケット名] [Dockerイメージのタグ名]

無事、S3にファイルが出力されました。

Fargate環境で実行の準備

準備１：ECRへの登録

Fargateで実行するため、DockerイメージをECR(Elastic Container Registry)に登録します。

リポジトリの作成

aws ecr create-repository --repository-name [リポジトリ名]

docker loginコマンドの取得と実行

aws ecr get-login --no-include-email

コンソールに出力されるコマンドを実行します。

リモートリポジトリに登録するローカルDockerイメージを指定する

docker image tag [ローカルのDockerイメージのタグ名] [リポジトリ名]:[リモートのDockerイメージ名]

Dockerイメージをリポジトリにプッシュする

docker image push [リポジトリ名]:[リモートのDockerイメージ名]

準備２：ECSのクラスターの作成

マネジメントコンソールでECSの画面を表示。クラスターを作成する。

設定項目	設定内容
クラスターテンプレートの選択	ネットワーキングのみ
クラスターの設定	このクラスター用の新しいVPCを作る

準備３：ECSのタスク定義の作成

マネジメントコンソールでECSの画面を表示。タスク定義を作成する。

設定項目	設定内容
起動タイプの互換性の選択	FARGATE
タスクとコンテナの定義の設定	↓↓↓
タスク実行ロール	`AmazonECSTaskExecutionRolePolicy`の他にS3へのPutObject権限も必要
コンテナの定義	↓↓↓
イメージ	ECRのイメージ URI(マネジメントコンソールで確認する）
環境変数	`BUCKET_NAME`にバケット名を指定

Fargate環境で実行（1回だけ実行）

タスク定義から作成したものを選び、アクションのタスクの実行を行います。

設定項目	設定内容
起動タイプ	FARGATE
クラスター	作成したもの
タスクの数	1
VPC	作成したもの

実行！！！

ウィザードの最後のタスクの実行を押すと、実行されます。

Fargate環境で実行（定期実行）

クラスターから作成したものを選び、画面下のタブにあるタスクのスケジューリングの先の作成を選びます。

設定項目	設定内容
スケジュールルールタイプ	お好みで
起動タイプ	FARGATE
タスク定義	作成したもの
タスクの数	1
クラスター VPC	作成したもの

実行！！！！

ウィザードの最後の作成を押すと、指定したスケジュールに従って実行されます。 固定された間隔で実行の場合、初回起動は作成を押してから固定された間隔が経過したあとになるようです。

まとめ

後半がかなり手抜きになりましたが、一応Fargateで動作するところまでできました。

参考サイト

AWS ECS/Fargate 操作覚え書き

S3バケットの作成​

データ変換用Lambdaの作成​

Kinesis Data Firehoseのストリームを作成​

CloudWatch Logsに付与するIAMロールを作成​

CloudWatch Logsサブスクリプションフィルターの作成​

完成​

参考​

Windows環境で実行​

環境​

Python仮想環境の作成​

ライブラリーの取得​

AWS CLIの設定(認証情報の設定)​

バケット名の指定（環境変数）​

実行！​

Docker環境で実行​

ファイルの用意​

Dockerイメージのビルド​

実行！！​

Fargate環境で実行の準備​

準備１：ECRへの登録​

リポジトリの作成​

docker loginコマンドの取得と実行​

リモートリポジトリに登録するローカルDockerイメージを指定する​

Dockerイメージをリポジトリにプッシュする​

準備２：ECSのクラスターの作成​

準備３：ECSのタスク定義の作成​

Fargate環境で実行（1回だけ実行）​

実行！！！​

Fargate環境で実行（定期実行）​

実行！！！！​

まとめ​

参考サイト​

S3バケットの作成

データ変換用Lambdaの作成