广泛使用的 GNU Awk 文本处理工具的开发者今天发布了 Gawk 5.4。
Gawk 5.4 现在正在使用新的 MinRX 正则表达式匹配器作为默认的 regexp 引擎。旧的 regex 和 DFA 引擎仍然可用,但 MinRX 引擎现在默认使用。这个新的匹配器是由 Mike Haertel 编写的,他是 GNU grep 的原始开发者。MinRX 匹配器完全符合 POSIX 标准,与现有的 GNU 匹配器不同。
Gawk 5.4 应该在读取常规磁盘输入文件时更快。Gawk 现在不再检查这些文件的超时,并且在大文件上发现速度提高了大约 9%。
Gawk 5.4 还改进了其 MinGW Windows 版本,以支持 UTF-8 编码的非 ASCII 文本。Gawk 的 Cygwin 版本现在也完全支持 UTF-8。
Gawk 5.4 还更改了持久内存的使用方式,支持 ordchr 扩展中的多字节字符,POSIX 2024 规范处理更改,C 代码中的断言现在已启用,改进了 BSD 支持,以及添加了 “–enable-o3” 构建选项,用于在构建 Gawk 时使用 -O3 编译器优化。这也是 Gawk 带有阿拉伯语翻译的第一个版本。
还更新了手册/文档,明确禁止在邮件列表上进行人身攻击,并强烈建议不要讨论专有软件。
最后,Gawk 5.4 增强了对 OpenVMS 的支持。

有关今天 Gawk 5.4 发布的下载和更多详细信息,请访问 GNU.org。
转自 GNU Gawk 5.4 Released With New MinRX Regex Matcher, Faster Reading Of Files – Phoronix
Linuxeden开源社区