来自github网友@ydq
给SpringBootCodeGenerator
贡献的正则表达式,非常不错,值得深刻学习.
private static final Pattern DDL_PATTERN = Pattern.compile("\\s*create\\s+table\\s+(?<tableName>\\S+)[^\\(]*\\((?<columnsSQL>[\\s\\S]+)\\)[^\\)]+?(comment\\s*(=|on\\s+table)\\s*'(?<tableComment>.*?)'\\s*;?)?$", Pattern.CASE_INSENSITIVE);
private static final Pattern COL_PATTERN = Pattern.compile("\\s*(?<fieldName>\\S+)\\s+(?<fieldType>\\w+)\\s*(?:\\([\\s\\d,]+\\))?((?!comment).)*(comment\\s*'(?<fieldComment>.*?)')?\\s*(,|$)", Pattern.CASE_INSENSITIVE);
public static void parse(String sql){
Matcher matcher = DDL_PATTERN.matcher(sql);
if (matcher.find()){
String tableName = matcher.group("tableName");
String tableComment = matcher.group("tableComment");
System.out.println(tableName + "\t\t" + tableComment);
System.out.println("==========");
String columnsSQL = matcher.group("columnsSQL");
if (columnsSQL != null && columnsSQL.length() > 0){
Matcher colMatcher = COL_PATTERN.matcher(columnsSQL);
while (colMatcher.find()){
String fieldName = colMatcher.group("fieldName");
String fieldType = colMatcher.group("fieldType");
String fieldComment = colMatcher.group("fieldComment");
if (!"key".equalsIgnoreCase(fieldType)){
System.out.println(fieldName + "\t\t" + fieldType + "\t\t" + fieldComment);
public static void main(String[] args){
System.out.println(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>");
parse("CREATE TABLE `userinfo` (\n" +
" `user_id` int(11) NOT NULL AUTO_INCREMENT COMMENT '用户ID',\n" +
" `username` varchar(255) NOT NULL COMMENT '用户名',\n" +
" `addtime` datetime NOT NULL COMMENT '创建时间',\n" +
" PRIMARY KEY (`user_id`)\n" +
") ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='用户信息'");
System.out.println(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>");
parse("CREATE TABLE `USER` (\n" +
"`ID` varchar(32) PRIMARY KEY COMMENT '主键',\n" +
"`password` varchar(32) NOT NULL COMMENT '密码',\n" +
"`username` varchar(32) NOT NULL COMMENT '用户'\n" +
") ENGINE=InnoDB DEFAULT CHARSET=utf8;");
System.out.println(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>");
parse("CREATE TABLE `tb_amount` (\n" +
"`ID` int(10) NOT NULL AUTO_INCREMENT,\n" +
"`PRODUCT_CODE` varchar(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NOT NULL COMMENT '产品代码',\n" +
"`GENDER` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '性别(male,female)',\n" +
"`MIN_INSURED_AGE` int(3) NULL DEFAULT NULL COMMENT '最小投保年龄',\n" +
"`MAX_INSURED_AGE` int(3) NULL DEFAULT NULL COMMENT '最大投保年龄',\n" +
"`AMOUNT` double(10, 2) NULL DEFAULT NULL COMMENT '基本保额',\n" +
"`PREMIUM_RATE` double(10, 2) NULL DEFAULT NULL COMMENT '基本保费',\n" +
"`YEAR_NUM` int(3) NULL DEFAULT NULL COMMENT '缴费年限',\n" +
"`PREMIUM_TYPE` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '费率类型',\n" +
"`INSURANCE_PERIOD` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '保险期间(30年,60年)',\n" +
"`INSURANCE_PERIOD_TYPE` varchar(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '保险期间类型(如定期年0,定期岁1,终身2,以后终身对应值:200)',\n" +
"`PAY_MODE` varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL COMMENT '交费方式',\n" +
"PRIMARY KEY (`ID`) USING BTREE\n" +
") ENGINE = InnoDB CHARACTER SET = utf8mb4 COLLATE = utf8mb4_0900_ai_ci ROW_FORMAT = Dynamic;");
控制台输出内容:
`userinfo` 用户信息
==========
`user_id` int 用户ID
`username` varchar 用户名
`addtime` datetime 创建时间
`USER` null
==========
`ID` varchar 主键
`password` varchar 密码
`username` varchar 用户
`tb_amount` null
==========
`ID` int null
`PRODUCT_CODE` varchar 产品代码
`GENDER` varchar 性别(male,female)
`MIN_INSURED_AGE` int 最小投保年龄
`MAX_INSURED_AGE` int 最大投保年龄
`AMOUNT` double 基本保额
`PREMIUM_RATE` double 基本保费
`YEAR_NUM` int 缴费年限
`PREMIUM_TYPE` varchar 费率类型
`INSURANCE_PERIOD` varchar 保险期间(30年,60年)
`INSURANCE_PERIOD_TYPE` varchar 保险期间类型(如定期年0,定期岁1,终身2,以后终身对应值:200)
`PAY_MODE` varchar 交费方式
前言有时候正则表达式不只是匹配一下什么数字/邮箱/身份证/日期等等,还需要匹配某一段文字,并按照既定格式提取其中的某些值.场景一:提取SAML2报文SAML2报文内容如下,从中提取对应的attribute name和value.<saml:AttributeStatement> <saml:Attribute Name="mail"> <saml:Att...
提取正则表达式匹配的内容
/** 数
值匹配正则表达式 */
private static final Pattern NUM_PATTERN = Pattern.compile("[0-9]");
* 解析
字符串中数
值
* @param text 含有数
值的
字符串,例如,库存剩余200件
* @return 数
值
public static Integer parseString(String text) {
Java 正则表达式(Regular Expression)是 Java 语言中用于模式匹配的一种工具。它可以用来验证文本是否符合特定的格式,也可以用来从文本中提取出符合特定格式的信息。
Java 使用 java.util.regex 包中的 Pattern 和 Matcher 类来支持正则表达式的匹配。通过调用 Pattern 类的静态方法 compile,可以将正则表达式编译为 Pattern 对象;通过调用 Pattern 对象的 matcher 方法,可以将文本与该 Pattern 对象进行匹配,并得到一个 Matcher 对象。可以通过调用 Matcher 对象的各种方法来验证文本是否与正则表达式匹配,并从文本中提取出符合要求的信息。
以下是一个简单的例子:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
public static void main(String[] args) {
String pattern = "\\w+";
String input = "Hello, world!";
Pattern compiledPattern = Pattern.compile(pattern);
Matcher matcher = compiledPattern.matcher(input);
while (matcher.find()) {
System.out.println(matcher.group());
在这个例子中,我们定义了一个正则表达式 `\w+`,表示一个或多个单词字符(即字母、数字和下划线)。然后,我们使用这个正则表达式匹配字符串 `Hello, world!`,并输出匹配到的结果。