4. Zpracovani textovych souboru
4.1 Editace textu
Pro editaci textu poskytuje
standardni UNIX interaktivni radkovy
editor ed, jeho vylepsenou
verzi ex, a editor vi, coz je editor
ex pracujici v obrazovkovem
rezimu. Tyto editory jsou standardni,
nepatri vsak k prilis oblibenym.
Naopak neinteraktivni (davkovy)
editor sed, ktery slouzi
jako editacni filtr se v UNIXu hojne
vyuziva.
Prikazy:
ed [-] [-x] [fname] editace
souboru fname
- tichy rezim
-x sifrovani ukladaneho textu
adresace radku:
expr cislo radku (pocatek
= 1)(num,-,+,/str/)
. soucasny radek
$ posledni radek
'char reference na definovany
odkaz char
e1,e2 usek souboru od radku
e1 po radek e2
prikazy: (mohou zacinat adresaci
radku)
q ukonceni editace
! cmd provedeni prikazu cmd
v shellu
f vypis jmena souboru
f fname nastaveni jmena souboru
e fname nacteni souboru fname
r fname pripojeni souboru
fname
w fname zapis souboru
W fname pripojeni za soubor
fname
p vypis radku
l vypis radku se specialnimi
znaky
= vypis cisla radku
k char definice odkazu char
na radek
a vkladani textu za radek
(konec .<CR>)
i vkladani textu pred radek
j spojeni radku (vynechani
<CR>)
d smazani radku
c nahrada useku
m num presun oblasti za radek
num
t num kopie oblasti za radek
num
g rozsireni prikazu na celou
zadanou oblast
v negace g
/str/ hledani retezce
// dalsi vyskyt pri hledani
?str? hledani retezce smerem
k zacatku
?? dalsi vyskyt smerem k
zacatku
s/str1/str2/ nahrada retezcu
metaznaky pro konstrukci hledaneho
retezce
. libovolny znak
[chars] znak z mnoziny chars
[^chars] znak, ktery neni
v chars
char* libovolny pocet opakovani
char (i 0)
^ pocatek radky
$ konec radky
\ch znak ch (eliminace spec.
vyznamu)
ex files ponekud komfortnejsi,
vice souboru,
ohlasovaci znak :, vyrovnavaci
pameti,
moznost aplikace prikazu
Unixu
vi file obrazovkovy rezim
editoru vi
rezim zobrazovaci (prochazeni
a vypousteni
textu x, dw, dd),
rezim vkladani (a,i,o)
prikazovy rezim (:) (editor
ex)
sed [-n] [-e script] [-f
sfile] [files]
neinteraktivni editor souboru
files
s vystupem do standardniho
vystupu
editor implicitne prenasi
vstup do vystupu
n potlaceni impl. prenosu
e script popis prikazu
f sfile popis prikazu v sfile
prikazy editoru odpovidaji
editoru ed
zpracovani probiha sekvencne,
nelze
pouzivat relativni adresaci,
neni prikaz m
a prikaz ! slouzi jako znak
negace prikazu
4.2 Tisk textovych souboru
Pro tisk textoveho souboru
se pouziva prikaz "lpr". Pro pripadnou
jednoduchou upravu souboru
do tiskove formy se pouziva filtr "pr".
Prikazy:
lpr [opts] [files] zarazeni
souboru files do tiskove fronty
-r zruseni souboru po tisku
-m ukonceni tisku oznameno
mailem
-P lpt urceni tiskarny
pr [opts] [files] uprava
souboru files pro tisk
-lN delka stanky N (impl.
66)
-t potlaceni hlavicky
-h str hlavicka str (impl.
datum, cas,
jmeno file a cislo str.)
-N vystup v N sloupcich
-wN sirka stranky N (impl.
72)
+N tisk od N-te stranky
4.3 Jednoduche zpracovani
textovych souboru
Prikazy:
wc [-lwc] files informace
o velikosti souboru
(lines words chars)
l pouze pocet radku
w pouze pocet slov
c pouze pocet pismen
grep [opts] expr [files]
filtr pro hledani vyskytu
vzoru retezce
daneho expr v souborech files
konstrukce retezce je stejna
s editorem ed
-v radky v niz nebyl nalezen
vzor
-c pouze pocet nalezenych
radku
-l pouze jmeno souboru
-n vypisuje poradove cislo
a radek
-s pouze navratovy kod (shell)
-h potlaci tisk jmena souboru
-i neni rozdil mala a velka
pismena
-e expr zadani vzoru (pokud
zacina -)
fgrep rychly grep s pevnym
textovym retezcem
egrep rozsireny grep s dalsimi
metaznaky
metaznaky:
char+ alespon jeden znak
char
char? nejvyse jeden znak
char
c1 | c2 c1 nebo c2
(expr) uzavorkovani
split [-N] [file [name]]
rozdeleni souboru file na
soubory o delce
N radku s jmenem namexx (xx
= aa,ab atd.)
(name=- funguje jako filtr)
tr [-cds] [str1 [str2]]
filtr pro nahradu znaku z
retezce str1
odpovidajicimi znaky v str2
c opacna nahrada (tj. znaku
krome uvedenych v str1)
d vypousteji se znaky ze
str1
s zkracuje vicenasobny vyskyt
znaku
sort [-bdfimnrtux] [+pos
[-pos]] [-o name] [names]
filtr pro setrideni souboru
names po radcich
b ignorovani levostannych
mezer
d slovnikove setrideni (alfanum.
znaky)
f konverze malych pismen
na velka
i ignoroju znaky mimo ASCII
33-127
m setrideni souboru do jednoho
n usporadani podle ciselne
hodnoty
r opacne setrideni
tx oddelovac poli je znak
x
u vynechani duplicitnich
radku
o name vystupni soubor name
+pos pocatek oblasti trideni
na radku
-pos konec oblasti trideni
na radku
(pos urceno jako m.n
m cislo pole (oddelena mezerou)
n cislo znaku v poli)
crypt [key] filtr pro zasifrovani
textu pomoci key
(obvykle se nedodava mimo
USA)
diff [-be] f1 f2 porovnani
obsahu souboru f2 s f1
vysledkem je seznam odchylek:
n1 a n3,n4 pridat n3-n4 za
n1
n1,n2 d n3 n1-n2 vypustit
na n3
n1,n2 d n3,n4 n1-n2 se zameni
n3-n4
< radky z file1
> radky z file2
b ignoruje rozdil mezera
a TAB
e vystup v konvenci editoru
ed
diff3 f1 f2 f3 porovnani
3 souboru
= = = = kazdy soubor jiny
= = = x lisi se soubor x
(=1,2,3)
f: n1 a pripojeni textu za
radek n1 v f
f: n1,n2 c zmena textu mezi
n1-n2 v f
comm [-123] f1 f2 porovnani
setridenych souboru f1 a f2
vystup: 3 sloupce
1.sloupec radky pouze v f1
2.sloupec radky pouze z f2
3.sloupec radky v obou souborech
-X potlaceni vystupu sloupce
deroff [-w] [files] filtr
odstranujici direktivy programu
troff, nroff, tbl a eqn (viz
4.5)
w rozdeleni textu na slova
spell [opts] files kontrola
pravopisu souboru files
-b kontrola na britskou anglictinu
spellin file udrzba slovniku
pravopisu
Dalsi prikazy bohuzel nejsou
soucasti SunOS 4.1.1:
style [opts] files analyza
stylu v souborech files
-a vypis vsech vet, delka
a citelnost
-rnum vypis vet s citelnosti
horsi nez num
-lnum vypis vet delsich nez
num
diction [-ml] [-f pattfile]
files
kontroluje frazeologii (zkomoleni,
chybne
fraze) v souborech files
ml v textu jsou nevetne casti
f file pripojeni databaze
frazi file
explain interaktivni nabidka
frazi (filtr)
4.4 Programovatelne manipulace
s textem
Prikaz "awk" predstavuje vykonny
interpret programovaciho jazyka,
ktery poskytuje rozsahle
moznosti pro manipulaci s textovymi
soubory. Popis tohoto programu
presahuje rozsah tohoto textu.
4.5 Formatovani textu
Zakladnimi prostredky pro
formatovani textu v OS UNIX jsou
textove procesory nroff a
troff. Nroff slouzi k priprave textu
pro radkove tiskarny, troff
pro fotosazeci stroj. Prace s obema
je vcelku podobna, troff
ma navic nektere schopnosti vyplyvajici
z vyssich schopnosti fotosazeciho
stroje. Formatovani textu
se provadi davkovym zpusobem
za pouziti souboru maker. Uvnitr
souboru jsou direktivy -
povely pro textovy procesor.
Pro formatovani tabulek slouzi
filtr tbl a pro matematicke vzorce
filtry eqn a neqn. Tyto filtry
predzpracovavaji textove soubory
procesory troff (tbl,eqn)
a nroff (tbl,neqn). Casti textu, ktere
nejsou pro ne urceny, tyto
filtry kopiruji do vystupniho souboru.
Popis techto programu, direktiv
a maker presahuje rozsah tohoto
textu.
|