cut linux command

作用

  • 分割一行文字,使用给定分隔符 seperator
  • 返回给定 field 内容

对比 awk

  • 类似 awk
  • 但是功能简单

参数

  • -f

    • 制定提取的 field 编号
  • -d

    • 制定分隔符
    • 默认值,制表符
    • -f 一起使用
  • 处理单位

FlashText -- Fast Text Extract and Replace Tool

特性

  • 不随词的数量增长,消耗时间快速增长

例子

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
# 创建工具
In [49]: p = flashtext.KeywordProcessor()

In [50]: p.add_keywords_from_dict({'a': ['b', 'c']})


# match单词
In [52]: p.extract_keywords('a b c')
Out[52]: ['a', 'a']

# match 包括 index
In [56]: p.extract_keywords('a b c', span_info=True)
Out[56]: [('a', 2, 3), ('a', 4, 5)]