# My words with more than 100 occurences in all posts: # ("the" . 1522) ("and" . 1230) ("to" . 963) ("A" . 960) ("of" . 931) ("is" . 747) ("I" . 732) ("it" . 672) ("s" . 618) ("in" . 561) # ("for" . 496) ("that" . 414) ("are" . 402) ("with" . 375) ("you" . 375) ("This" . 324) ("my" . 304) ("C" . 303) ("but" . 294) # ("not" . 292) ("https" . 272) ("one" . 257) ("as" . 244) ("on" . 222) ("F" . 217) ("there" . 216) ("So" . 216) ("t" . 210) # ("or" . 196) ("Lisp" . 193) ("can" . 193) ("all" . 190) ("code" . 189) ("if" . 175) ("like" . 173) ("here" . 169) ("Be" . 167) # ("m" . 162) ("By" . 160) ("from" . 160) ("use" . 158) ("com" . 150) ("some" . 149) ("function" . 146) ("an" . 144) ("What" . 139) # ("have" . 139) ("No" . 138) ("your" . 134) ("x" . 133) ("aartaka" . 131) ("more" . 130) ("HTML" . 128) ("0" . 119) ("at" . 117) # ("Artyom" . 115) ("we" . 114) ("github" . 114) ("me" . 113) ("Regex" . 113) ("They" . 112) ("Bologov" . 111) ("these" . 109) # ("Any" . 106) ("ed" . 102) ("org" . 101) # # Warning: this script is not idempotent, removing one layer of slashes and compacting the newlines. # Do not run more than once per file! H # Mark ends of lines g/$/s//|||/ # Isolate and join the verbatim blocks g/PRE(/.,/PRECAP/j # De-abbreviate letters/combinations: # REMOVED due to uselessness, see commit 710b401 # URL shorteners g/gh:\([[:alnum:]-]\)/s||https://github.com/\1|g g/hs*:\([[:alnum:]-]\)/s||https://\1|g g/yt:\([[:alnum:]_-]\)/s||https://www.youtube.com/watch?v=\1|g # Remove trailing markers g/|||$/s/// # Join escaped newlines g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j g/\([^\\]\)\\$/j # Unescape escaped chars v/PRE(/s/\\\(.\)/\1/g # Split everything again g/|||/s//\ /g w Q