乐观的甜瓜 · 调用CreateNatGateway创建NA ...· 7 月前 · |
爱看书的熊猫 · django多任务开启rabbitmq,并进 ...· 1 年前 · |
踏实的碗 · Java 枚举(enum) ...· 1 年前 · |
更新时间: 2023.08.08 10:34:56
LogCollector 采集配置支持多行完整正则模式采集日志。在多行完整正则模式下,LogCollector 通过指定的行首正则匹配日志开头,通过提取正则表达式去解析日志字段,并将其提取为多个键值对。多行完整正则模式适用于多行、且需要进行结构化处理的日志。
LogCollector 通过完整正则模式采集日志时,以
\n
换行符作为日志结束的标识符,以指定的正则表达式提取日志字段,并使用自定义的 Key 作为字段名,对日志数据进行个性化的结构化处理。
日志服务对 LogCollector 采集到的原始日志数据进行以下处理。
根据指定的正则表达式提取日志字段,提取到的数据为字段值(Value),其字段名(Key)可自定义。
日志时间可使用采集日志时 LogCollector 所在服务器的系统时间,或通过 使用采集时间 指定为日志时间字段中的时间。
日志中增加以下元数据字段,并默认为其创建索引。
预留字段 | 说明 |
---|---|
__path__
|
日志的源文件目录与文件名。 |
__source__
|
日志源服务器的 IP 地址。 |
选择日志主题。
选择日志主题,采集到的日志数据会存储在指定主题中,以日志主题为维度进行查询和分析。 如果没有合适的日志主题,可以根据页面提示创建新的日志主题。
配置机器组。
在
全部机器组
区域中选择需要采集日志的机器组,并在
已选机器组
区域中确认选择的机器组是否正确。
单击 下一步 。
填写 规则名称 。
规则名称 即 LogCollector 采集配置的名称。需要满足以下要求:
您也可以单击 导入其他采集配置 ,选择当前账号下指定日志项目中的指定采集配置,将已创建的其他采集配置导入到当前新配置中。新配置的采集规则默认和指定配置相同,您只需要指定采集规则名称即可。
选择是否启用
容器日志采集
。
采集宿主机日志及 Sidecar 方式采集容器日志时,此配置应维持默认的关闭状态。
填写 采集路径 。
采集路径 即日志所在的目录和文件名,LogCollector 会按照采集路径中的目录部分匹配符合规则的目录,监听这些目录下符合规则的日志文件。最多设置 10 个不同的采集路径。
采集路径可以指定完整的目录和文件名,也可以通过通配符模糊匹配。
说明
**
时,表示多层目录匹配,仅在此时,日志服务才会监听指定目录下深至8级的子目录。
常见的采集路径的配置方式及示例如下。
配置方式 | 日志路径示例 | 说明 |
---|---|---|
完整名称 |
|
指定完整的目录和文件名,不包含通配符,表示监听指定目录下的指定文件,不监听其子目录。
|
文件名模糊匹配 |
|
不指定文件名,表示监听所有日志文件;指定部分文件名规则,表示监听符合规则的部分文件。
|
路径模糊匹配 |
|
通过
|
设置
采集路径黑名单
。
配置采集路径黑名单之后,日志服务通过 LogCollector 采集日志时,会忽略指定的目录和文件。选择 启用 后,请根据页面提示设置黑名单目录和文件。
说明
/var/log/project/*.log
,需要过滤其中
/var/log/project
目录下的所有子目录,则
采集路径黑名单
应设置为
目录路径
,配置路径为
/var/log/project/**
。
采集路径黑名单中的路径类型支持设置为 目录路径 和 文件路径 。
配置 | 说明 |
---|---|
目录路径 |
采集时忽略指定的目录。目录路径支持完整匹配和通配符模式匹配。
|
文件路径 |
采集时忽略指定的文件,需配置文件路径及文件名。文件路径支持完整匹配和通配符模式匹配。
|
设置
采集策略
。
采集策略表示 LogCollector 采集增量日志还是全量日志。默认为增量日志。
配置 | 说明 |
---|---|
全量 | LogCollector 从每个文档的起始位置开始采集日志,此时 LogCollector 会采集历史日志数据。 |
增量 |
LogCollector 采集日志时,只采集文件内新增的内容。监控范围内的日志文件写入新的日志时,触发 LogCollector 日志采集行为。对于首次采集的日志文件:
|
配置 | 说明 | |
---|---|---|
采集模式 | LogCollector 解析日志文件的模式,请配置为 多行完整正则 模式。 | |
日志样例 |
填写真实的日志样例作为字段解析和提取的模板。
|
|
行首正则表达式 | 行首正则表达式是用于识别日志开头的正则表达式,匹配到的部分将作为日志开头。支持自动生成或手动输入行首正则表达式。 | |
自动生成 |
日志服务根据已填写的日志样例自动生成行首正则表达式。页面提示的 匹配行首数 和日志样例中的日志数量相同,表示自动生成成功。 说明 自动生成 功能仅适用于英文字符的正则表达式提取,暂不支持中文字符。
|
|
手动输入 |
手动输入行首正则表达式,并单击
立即验证
。日志服务会根据此正则表达式去匹配日志内容,并将匹配到的部分作为日志的开始。页面提示的
匹配行首数
和日志样例中的日志数量相同,表示验证通过。
|
|
提取正则表达式 | 提取正则表达式即日志样例对应的正则表达式,日志服务会用其解析并提取日志字段。您可以选择不同的提取模式,手动或自动生成正则表达式,并在 提取结果 区域确认正则表达式对于日志样例的提取结果。 | |
自动生成 |
开启 自动生成 功能后,页面会根据鼠标划词自动提取正则表达式。
说明
|
|
手动输入 |
关闭
自动生成
功能即手动设置正则表达式。设置后单击
立即验证
,日志服务会根据已输入的正则表达式匹配
日志样例
中的内容,提取键值对。
说明
|
(可选)启用
插件配置
。
通过 LogCollector 采集文本日志时,如果业务日志结构复杂、格式不固定,无法通过 JSON 模式等常规的日志采集模式进行解析时,可以通过 LogCollector 插件进行采集后处理。详细说明请参考 插件概述 。
(可选)启用
高级设置
。
请根据您的需求选择高级配置。如果没有特殊需求,建议保持默认配置。
配置 | 说明 |
---|---|
过滤器 |
是否开启日志字段过滤规则。默认为关闭状态。开启后,通过正则表达式配置过滤规则,完全匹配正则表达式的日志才会被采集上报,帮助您筛选出有价值的日志数据。
|
上传解析失败日志 |
是否上传解析失败的日志,默认为关闭状态。
|
解析采集路径 |
通过正则表达式提取采集路径中的字段,并将其作为元数据添加到日志数据中。此功能默认为关闭状态。
|
HashKey路由Shard |
指定 HashKey 将数据写入到符合范围要求的日志分区。此功能默认为关闭状态。
|
上传原始日志 |
开启后,原始的日志数据将被封装在
|
上传常量字段 |
开启后,LogCollector 会将指定字段的 Key 和 Value 封装到每一条日志中。常量字段需遵循以下限制:
|
使用采集时间 |
设置是否 使用采集时间 。 使用采集时间 默认为开启状态。
说明
|
扩展配置 |
LogCollector 扩展配置,JSON 对象格式。目前支持的参数包括 CloseInactive、CloseRemoved、CloseRenamed、CloseEOF 和 CloseTimeout。详细的参数说明请参考
Advanced
。
|
确认采集配置,并单击 下一步 。
更新索引。
根据页面提示,按需设置或更新索引。索引默认为关闭状态,启用索引后才能检索分析采集到的日志数据。
确认索引配置,并单击 提交 。
创建采集配置之后,LogCollector 会根据指定规则开始监听日志文件并采集日志,日志数据将保存在指定的日志主题中。
日志索引默认为关闭状态,您需要为日志主题开启索引功能,并配置索引,才能在控制台中对采集到的日志数据进行查询分析。