File: dupword.awk

package info (click to toggle)

gawk 1%3A3.1.5.dfsg-4

links: PTS
area: main
in suites: etch, etch-m68k
size: 9,144 kB
ctags: 3,545
sloc: ansic: 31,602; awk: 4,970; sh: 4,409; yacc: 2,634; makefile: 1,358; sed: 16

file content (21 lines) | stat: -rw-r--r-- 504 bytes

parent folder | download | duplicates (4)

# dupword.awk --- find duplicate words in text
#
# Arnold Robbins, arnold@gnu.org, Public Domain
# December 1991
# Revised October 2000

{
    $0 = tolower($0)
    gsub(/[^[:alnum:][:blank:]]/, " ");
    $0 = $0         # re-split
    if (NF == 0)
        next
    if ($1 == prev)
        printf("%s:%d: duplicate %s\n",
            FILENAME, FNR, $1)
    for (i = 2; i <= NF; i++)
        if ($i == $(i-1))
            printf("%s:%d: duplicate %s\n",
                FILENAME, FNR, $i)
    prev = $NF
}