# Počítačové systémy

## CPU

- ABI
- MIPS registry – jejich účely (jak by se měly používat) jsou popsány v MIPSovém ABI
	- je lepší používat přímo jména registrů v ABI – aby případné přečíslování registrů nedělalo problém
	- různé funkce registrů
- základní instrukce
	- součet dvou registrů, uložení do (třetího) registru
		- na rozdíl od x86 umí MIPS uložit výsledek do třetího registru
	- přičtení 16bit. konstanty k registru, uložení do registru
	- podobně rozdíl, odečtení konstanty
	- logické operace – and, or, xor, nor (or + negace)
	- negace se dělá pomocí `nor $t1,$t2,$t2`
	- bitové posuny
	- přístup do paměti
- MIPS instrukce
	- nepodmíněné skoky
		- na adresu (j)
		- skok přes obsah registru (jr)
		- jump and link (jal; pro uložení návratové adresy do registru 31 a skok do podprogramu – návrat pomocí jr 31; kdybychom chtěli skákat do vnořených funkcí, tak bychom potřebovali zásobník)
	- podmíněné skoky – equal, not equal (beq, bne)
	- porovnávání – slt (menší než), sltu (unsigned), slti (immediate), sltiu
		- na x86 pomocí odčítání a příznaků
	- `lw $t0, 4($gp)` načte hodnotu z místa, kde jsou v paměti globální proměnné, offset 4
	- násobení (malými čísly) se převádí na sčítání pomocí binárního rozkladu
- příznaky na x86
	- rezervované, systémové, aritmetické
	- typicky se používá zero flag (1 když u poslední operace vyšla nula), sign flag (kopie MSb znaménkového čísla), carry flag (přetečení a podtečení v bezznaménkové aritmetice)
- ISA – shrnutí
	- ISA je abstraktní model, často může být odtržený od implementace
	- u x86 architekturu vlastní společně Intel a AMD
	- tradiční klasifikace
		- CISC – Complex Instruction Set Computer
			- lidi píšou programy v asembleru
		- RISC – Reduced…
			- překládám program překladačem z vyššího programovacího jazyka
			- např. x86 (původně)
		- VLIW – Very Long Instruction Word
			- není potřeba dekódovat instrukci, rovnou je z ní jasné, co mají které části procesoru dělat
		- EPIC – Explicitly Parallel Instruction Computer
			- v jedné instrukci je jich několik (?)
	- ortogonalita – mám obecné registry a instrukce, které můžu používat s libovolnými registry (x86 není ortogonální; obecně akumulátorové instrukční sady nejsou ortogonální)
	- architektura typu Load-Execute-Store – máme zvlášť instrukce na load a store, s pamětí nejde dělat nic jiného
- hardwarová architektura
	- procesor
		- řadič paměti
		- cache
		- jádra – logické procesory + registry
	- hyper-threading – na jedné výpočetní jednotce (uvnitř jádra) běží dvě instrukce najednou
		- uvnitř jednoho jádra jsou dvě vlákna (logické procesory) – může jich být i víc
		- zvyšuje to výkon, schovává to latenci přístupu do paměti
		- každé vlákno má své registry
	- hierarchie keší
		- privátní (na každém jádru)
			- L1I a L1D – malé keše
			- L2 – větší, pro kód (instrukce) i data
		- sdílená
			- L3/LLC – velká; dneska má obvykle každé jádro vlastní L3\$ slice
	- 95 % přístupů do paměti jde z nějaké úrovně cache (což je fajn, protože paměť je pomalá)
	- out-of-order execution – instrukce si procesor popřehází, aby to bylo rychlejší (ale výsledek odpovídá tomu, jako by je vykonával ve správném pořadí)
- pipeline
	- jednotlivé kroky (stage) jedné instrukce: načtení instrukce z paměti, její dekódování, vykonání, paměťová operace, zápis výsledku do registru
	- najednou se můžou vykonávat všechny kroky instrukce (takže vlákno v jednu chvíli zpracovává pět instrukcí – u každé z nich je v jiné stagi)
	- je potřeba řešit správné pořadí zápisů a načtení dat
	- problém s podmíněnými skoky – ve chvíli, kdy zjistím, že mám skákat, už bych vykonával stage u dalších instrukcí
		- používá se branch predictor, zkouší odhadnout, kam se skočí
		- když to odhadne špatně, tak se pipeline restartuje
		- hledá ve skákání nějaké vzory, zkouší hádat
		- pokud instrukci na dané adrese nikdy neviděl, tak zpětný skok předpokládá, naopak dopředný skok nikoliv
- superskalární procesor
	- jsme schopni souběžně zpracovávat více instrukcí
	- dnešní procesory jsou pěticestné – najednou zpracovávají pět instrukcí
	- dnes se používá asymetrická superskalarita – jedna pipeline je silnější a zvládá všechno, čtyři zbývající jsou slabší a zvládají jenom jednoduché instrukce
- out-of-order execution
	- mikroinstrukce se umístí do poolu a čekají, až budou mít výkonné jednotky volno
	- jednotlivé jednotky umí různé věci

## Paměť

- podle rychlosti: registry, cache, RAM, perzistentní RAM, SSD + flash disky, HDD, magnetické pásky
	- od perzistentní RAM (včetně) ta média drží data po vypnutí
	- po perzistentní RAM (včetně) jsou uložená data přístupná CPU, zbytek je obsluhován vždy nějakým řadičem (jako externí I/O)
- paměť – definice
	- každá paměť se skládá z paměťových buněk – bitů
	- bity jsou seskupeny do slov fixní délky
	- každé slovo je přístupné binární adresou (podle délky adresy rozlišujeme např. 32 nebo 64bitovou architekturu)
		- můžeme uložit $2^N$ slov, kde $N$ je délka adresy
	- dnes se používá 8bitové slovo (bajt)
- fyzický pohled na paměť
	- paměť je vlastně dvojrozměrná
	- adresa se dekóduje tak, aby paměťový řadič našel správnou řádku a sloupec v ní
	- když bajty jsou za sebou, jsou v jedné řádce
	- časování
		- CAS – Column Access Strobe, kolik taktů trvá, než jsem schopný adresovat další sloupec uvnitř jedné řádky (tento parametr ovlivňuje cenu paměti)
		- další 3 parametry
- datová reprezentace
	- celá čísla
		- bezznaménková
			- jednoduchá binární reprezentace čísla
			- obvykle 1, 2, 4, 8 bytů
			- reprezentovaný rozsah $[0;2^N-1]$
		- znaménková
			- dvojkový doplněk
			- bitová negace + 1
			- pouze jedna 0
			- kompatibilní s bezznaménkovou aritmetikou
			- asymetrický rozsah $[-2^{N-1};2^{N-1}-1]$
			- MSb určuje znaménko čísla
	- desetinná čísla – float
		- $\text{value}=(-1)^{\text{sign}}\cdot\text{significand}\cdot 2^{\text{exponent}-\text{bias}}$
		- tohle je reprezentace v paměti, procesory si to ukládají po svém
- endianita – vícebytová čísla se v paměti ukládají tak, že je MSB na začátku (big endian), nebo LSB na začátku (little endian)
- zarovnání dat
	- moderní procesory vyžadují, aby byla data v paměti zarovnaná podle jejich velikosti
	- např. 4bajtový int musí mít adresu zarovnanou na 4 (dělitelnou čtyřmi)
	- celá struktura (struct) je zarovnaná na největší datový typ dostupný na CPU (např. 16B)
	- některé jazyky přehazují položky ve struktuře, aby se eliminovalo volné místo
	- sizeof vrátí velikost včetně těch mezer 
- správa paměti
	- globální proměnné – přiřazena na začátku, celou dobu drží svoji hodnotu, je na jednom místě v paměti
	- lokální proměnné, argumenty funkcí – uloženy na zásobníku
	- dynamicky alokované proměnné – programátor je explicitně alokuje (pomocí `malloc()`, `new`, `unique_ptr`, …), existuje vyhrazený blok paměti pro tyto alokace
- alokace paměti
	- úkol – najdi blok nepoužité paměti dostatečné velikosti, alokuj část velkého poolu paměti (používá se pojem heap)
	- životní cyklus – alokuj blok, použij blok, uvolni blok
	- vždy existuje určitý počet bytů, který lze minimálně alokovat – takže na jednobytovou proměnnou se alokuje zbytečně moc paměti (proto není dobré příliš používat `new`)
- fragmentace
	- interní – v bloku je alokováno více paměti, než je potřeba
	- externí – volná paměť je rozdělena do malých bloků a mezi nimi jsou bloky alokované paměti
- dynamická alokace paměti – mám spojový seznam volných bloků nebo bitmapu (kde každý bit reprezentuje jeden blok)
- alokační algoritmy
	- first fit – začíná na začátku, najde první dostatečně velké volné místo
	- next fit – stejné jako first fit, akorát začíná na pozici, kde bylo alokováno naposledy
	- best fit – začíná na začátku, najde nejmenší dost velké volné místo
		- vytváří malinké díry
	- worst fit – začíná na začátku, najde největší místo
- cvičení na alokaci – alokuju do 64B bloků
	- alokuju A, což je 42 B, nejbližší násobek je 64 B
	- 2 KiB je násobek 64 B, alokuju za A
	- 100 B – alokuju 128 B
	- atd.
	- pak dealokuju nějaké bloky
	- alokuju dál pomocí nějaké metody – podle toho se bloky alokují na nějaké místo
- buddy memory allocation
	- bloky velikosti $2^N$, adresy zarovnány na násobek své velikosti
	- hledám nejmenší volný blok, který odpovídá požadované velikosti
	- když je blok moc velký, tak ho rozpůlím
- cache
	- hardwarová nebo softwarová struktura, v níž jsou uložena data, aby se zrychlily operace s nimi
	- velikost cache je omezená
	- CPU používá cache, aby zrychlil přístup do paměti (když má data uložená v cachi, nechodí pro ně do paměti)
	- cache je tvořena jednotlivými řádky (obvykle mají 64 bajtů, jsou zarovnány)
	- cache hit – požadavek je odbaven z cache
	- cache miss
		- data nebyla nalezena v hierarchii cache
		- provádí se přístup do paměti
		- načtená data se ukládají do cache
		- pokud není volná cache line, uloží se na místo jiné cache
			- tato původní cache se propisuje do hlavní paměti (při zapisování dat totiž procesor zapisuje do cache)
	- stav cache line se udržuje pomocí MESI protokolu
	- technická realizace cache = asociativní paměť
		- je to v podstatě tabulka – vlevo klíč (odpovídající adresa v paměti), vpravo hodnota (cache line)
		- konstantně rychle se v ní hledá klíč
		- rychlost se zajišťuje hardwarově
- víceprocesorový systém
	- SMP – symetrický multiprocessing
		- všechny procesory přistupují do paměti přes systémovou sběrnici
		- přístupy jsou stejně rychlé
	- NUMA – non-uniform memory access
		- každý procesor má „svůj“ blok paměti
		- jeden společný adresový prostor vzniklý sloučením bloků jednotlivých pamětí
		- každý procesor může adresovat libovolnou paměť
		- přístupy jsou různě rychlé – přístupy do „cizích“ pamětí trvají déle

## Programovací jazyky

- překladač, gramatika
- překlad
	- preprocesor
	- kompilátor (překladač)
	- assembler
	- linker
- knihovna – statická nebo dynamická sada binárek
- linking – spojení binárek do jedné
- loader – načte program do paměti
- program vs. proces (proces je spuštěný program, entita operačního systému)
- knihovna se linkuje do souboru .lib (statická knihovna)
	- lidi už pak používají přímo hlavičkový soubor a statickou zkompilovanou knihovnu
	- pokud je knihovna statická, použije ji linker, pokud je dynamická, použije ji až loader
- organizace paměti
	- u toho procesu musí OS nějak řešit paměť
	- překladač jednotlivé části programu dává do správných segmentů
		- příklady segmentů – globální proměnné, konstanty, instrukce…
	- v paměti je kód, statická data, zásobník (vzájemné volání funkcí, lokální proměnné) a halda (na dynamickou alokaci proměnných)
	- realističtěji – kód, konstanty, inicializovaná statická data (např. `int x = 5;`, konkrétní hodnoty jsou umístěny ve spustitelném souboru), neinicializovaná statická data (např. objekty – konstruktor se volá až při běhu programu), jeden zásobník pro každé vlákno (při rekurzi může dojít), halda
- linking
	- linker vezme segmenty z každého souboru a slije je dohromady
	- z knihovny do výsledného souboru skládá jenom ty funkce, které jsou opravdu použity
	- linker přepočítává adresy na základě toho, jak za sebe skládá segmenty (začátek segmentu je na adrese 0)
	- loader pak ty adresy po spuštění přepočítává znova podle toho, kde jsou segmenty uloženy v paměti
- volací konvence
	- každá funkce má na zásobníku aktivační záznam
	- na zásobník uložím (z registrů) návratovou adresu a adresu aktivačního záznamu funkce, která mě volala
	- některé další registry (které mají vlastnost Preserve) uložím do zásobníku, aby nebyly poškozeny
	- volací konvence jasně deklaruje, jak se hodnoty předávají z volané funkce do volající
	- volající funkce připraví na zásobníku prostor (strukturu) pro vrácenou hodnotu, překladač adresu této struktury předá volané funkci jako parametr
	- relativní adresace lokálních dat a dočasných proměnných – adresy se počítají relativně vůči frame pointeru
	- technologie linkeru a loaderu je stará a nepočítala s přetížením funkcí – proto se dělá public name mangling (do jmen funkcí se vkládá otisk typů a jmen parametrů)
	- musí být jasně definované, co každá funkce uklízí
	- parametry fungují v podstatě stejně jako lokální proměnné
	- předávání parametrů
		- předání hodnotou – na zásobník dám kopii vypočítané hodnoty parametru
		- předání referencí – na zásobník dám ukazatel (adresu) na parametr
			- v C se všechny parametry předávají hodnotou, takže se vlastně pointery kopírují
- proměnné
	- proměnná = pojmenovaný kus paměti, v němž je uložena hodnota; má typ
	- způsob uložení
		- statická data – globální proměnné v C
		- zásobník – lokální proměnné v C
		- halda – dynamická paměť v C/C#
	- slovník (Python, PHP, JavaScript)
		- dynamická struktura
- halda
	- úložiště pro dynamickou paměť
	- alokace – vedeme si evidenci volných bloků, používá se nějaký ze zmíněných algoritmů
		- alternativní přístup – inkrementální alokace, vycházíme z předpokladu, že paměť nedojde
	- dealokace – někde explicitní (C, C++), jinde automatická pomocí garbage collectoru
		- když přijdu o pointer na objekt v paměti (takže ho nemůžu smazat) = memory leak
		- u explicitní dealokace se používá funkce free – může být problém, pokud ji na jeden objekt voláme víckrát
		- GC se spustí, jakmile dojde paměť
		- při běhu garbage collectoru se může běh programu úplně zaseknout
		- přístupy k GC
			- tracing – procházíme všechny živé objekty a hledáme, co je z nich dosažitelné
			- reference counting
- přenositelnost kódu
	- může se lišit velikost typů na různých architekturách (u některých jazyků)
	- někdy může hrát roli i endianita
	- některé překladače mají specifické funkce (nebo syntaxi) navíc – ty není dobrý nápad používat
	- volání funkcí OS přímo pomocí příkazů (někdy to není problém, pokud OS používají stejnou knihovnu)
	- přenositelnost se někdy řeší pomocí virtuálního stoje (VM)
		- C#, Java
		- program se přeloží do bytecodu (Java) nebo CIL (C#)
		- jsou to „instrukce procesoru, který neexistuje“
		- pak je tam běhová podpora, která zpracovává instrukce abstraktního procesoru a vykonává instrukce toho konkrétního procesoru, na kterém běží – tenhle přístup je extrémně pomalý
		- výhoda: lze to zavřít do sandboxu
		- řešení problémů s rychlostí
			- JIT (just in time) kompilace – překládá mezikód do nativního kódu na vyžádání, pokud daný překlad ještě neexistuje
			- AOT (ahead of time) kompilace – při instalaci program přeložím do nativního kódu (používá se třeba u Androidu)

## Operační systém

- role OS
	- abstraktní stroj
		- je reprezentován rozhraním jádra
		- schovává komplexitu hardwaru
	- správa zdrojů
		- management hardwaru zajišťuje OS
		- sdílení HW mezi aplikacemi
			- alokace paměti
			- procesorový čas
			- abstrakce (disk, síť)
- režimy procesoru (bývá jich několik, ale nejdůležitější jsou dva)
	- uživatelský režim
		- přístupný všem aplikacím
		- omezený přístup ke zdrojům
	- kernel mode
		- je používán operačním systémem nebo jeho částí
		- má plný přístup ke zdrojům
	- přechod mezi režimy je jasně definovaný – je pouze omezené množství způsobů, jak přepnout z uživatelského do kernel režimu (aby bylo možné vyhodnotit, zda je to záměr, nebo chyba)
		- syscall = volání systémového API
		- tenká vrstva nad OS zajišťuje syscally
- architektura
	- monolitická
		- obslužná vrstva, jejím prostřednictvím se volají interní funkce
		- takhle funguje linuxový kernel
		- zranitelnost – programy v jádře mohou dělat cokoliv
		- původně byly součásti jádra pevně nastavené od instalaci
			- problém – při připojení klávesnice chceme nainstalovat driver zařízení -> dnes lze obsah jádra měnit
	- vrstvená
		- každá vrstva má svoje rozhraní
		- každá vrstva může používat jenom vrstvu přímo pod ní (její rozhraní)
	- mikrokernel
		- většina služeb se z kernel space vystrčí do user space, jsou tam jako jednotlivé moduly, ty komunikují bez sebou a s jádrem
		- je to rozšiřitelné, spolehlivé (jednotlivé služby lze v případě chyby restartovat) a bezpečné, ale poměrně pomalé
		- takhle fungují Windows
			- mají ještě hardwarovou abstrakční vrstvu, takže mikrokernel je přenositelný
			- služby běží v kernel režimu (což je v rozporu s filozofií mikrokernel)
- zařízení
	- pojmy
		- řadič zařízení (controller) – HW součástka, komunikuje se zařízením nějakým protokolem
		- ovladač zařízení (driver) – SW komponenta, součást operačního systému, realizuje komunikaci s řadičem, poskytuje operačnímu systému jednotné komunikační zařízení
		- BIOS/UEFI – inicializuje zařízení při bootu
	- topologie zařízení
		- sběrnice
			- řadič, z něj vychází jeden drát, na něj jsou všechna zařízení připojena
			- na jedné sběrnici je přetlak
			- při paralelním vedení drátů je problém s přeslechy (vzájemné rušení signálů)
		- hvězda
			- každé zařízení je připojeno k řadiči samostatně
			- takhle funguje SATA
			- nevýhoda – na řadiči musí být víc konektorů
			- výhoda – na drátu není nikdo jiný, takže není potřeba řešit adresaci
			- používají se sériové protokoly – jsou rychlejší než paralelní
		- ring
			- signál se po kruhu pohybuje jedním směrem – každé zařízení (i řadič) jedním portem vysílá a druhým přijímá
		- strom
			- k řadiči můžu připojit rozbočovač (hub)
			- takhle funguje USB
	- jak CPU provádí I/O operace
		- buď má speciální instrukce, nebo používá memory-mapping
	- uživatel chce nějaké množství dat – jejich získání zajišťuje kernel/řadič (může být potřeba několik dotazů)
	- komunikace se zařízeními
		- polling – CPU se aktivně ptá na změnu stavu zařízení (pomalé, dnes už se nepoužívá)
		- přerušení – řadič vyšle signál, že je operace hotová, a přeruší chod procesoru (ale pořád musím kopírovat data, což je pomalé)
		- DMA (Direct Memory Access) – přenos dat ze zařízení do paměti probíhá hardwarově bez účasti procesoru, až pak se provede přerušení; funkce scatter/gather umožňuje využívat nesouvislé části paměti
	- typy přerušení
		- externí – hardwarové pomocí IRQ pinu, lze ho zamaskovat (deaktivovat – pomocí registru)
		- (hardwarová) výjimka – nastal problém s instrukcemi -> procesor vyvolá přerušení a nechá na OS, aby situaci vyřešil
			- výjimka typu trap se volá po instrukci, např. dělení nulou
			- u výjimek typu fault se procesor vrátí na stav před instrukcí, nechám OS, aby problém opravil, a potom instrukci pustím znova
		- softwarové – speciální instrukce
	- jak funguje přerušení
		- CPU zjistí zdroj přerušení
		- získá adresu handleru
		- proud instrukcí je přerušen
		- handler uloží stav CPU
		- handler udělá něco užitečného
		- handler obnoví stav CPU
		- CPU pokračuje v proudu instrukcí
- program = pasivní soubor na disku
- loader – vezme program a načte ho do paměti
- někde v hlavičce programu je informace o tom, kde program (výkon instrukcí) začíná
- proces
	- instance programu vytvořená operačním systémem
	- je to datová struktura uvnitř operačního systému, v níž jsou uložené různá data, která daný program potřebuje
	- vlastní: kód, prostor v paměti, další prostředky
- vlákno (thread)
	- místo uvnitř procesu, kde se vykonávají instrukce
	- kontext procesoru – datová struktura, ve které jsou uložené registry procesoru, pokud dané vlákno zrovna neběží
	- vlastní: pozici v kódu (program counter), svůj zásobník, stav procesoru
- fiber
	- lightweight vlákno
	- nemá celý kontext
	- scheduling se dělá kooperativně (jednotlivé fibery se vzájemně vyměňují v běhu)
- scheduler – část operačního systému, používá schedulingové algoritmy k přidělení zdrojů (jader) jednotkám
- když se přeruší vykonávání vlákna, provede se context switch – kontext procesoru se uloží
- real-time scheduling: real-time proces má čas, kdy se má spustit, a čas, do kdy má skončit (hard deadline – nemá smysl pokračovat, soft deadline – má smysl pokračovat ve výpočtu)
- stavy vlákna
	- created
	- ready
	- running
	- blocked
	- terminated (zombie)
- multitasking
	- cooperative – všechny procesy kooperují, předávají si řízení
	- preemptive – každé vlákno dostane od scheduleru svůj time slice; jakmile čas vyprší, dojde k přerušení
- scheduling
	- priorita – vázaná na proces
		- je dvousložková – při spuštění se přiděluje statická priorita (podle uživatele), dynamická priorita se v časových intervalech pravidelně zvyšuje všem ready vláknům (po spuštění se dynamická priorita sníží na nula); celková priorita je daná součtem
	- kooperativní algoritmy
		- first come, first serve (FCFS)
			- FIFO řada, procesy se vykonávají v pořadí, ve kterém přišly
		- shortest job first
			- musí být známý očekávaný čas běhu
		- longest job first
	- preemptivní algoritmy
		- round robin
			- jako FCFS
			- když vlákno trvá moc dlouho, tak se zařadí na konec fronty
		- multilevel feedback-queue
			- každá fronta má jinak dlouhý time slice
			- první (horní) ho má kratší, ty pod ní ho mají delší
			- když vlákno trvá moc dlouho, tak se zařadí na konec nižší fronty
			- když se vlákno brzo zablokuje, tak se zařadí na konec vyšší fronty
		- completely fair scheduler (CFS)
			- používá červeno-černý strom
- komunikace mezi procesy (inter-process communication = IPC)
	- kooperující procesy – jejich zdroje jsou izolovány operačním systémem, ke komunikaci používají OS-specifické IPC API
	- typické IPC metody
		- pipes (nebo jiný typ socketů)
		- sdílená paměť
		- signály
- soubor
	- jednotka organizace dat
	- kolekce souvisejících informací
	- jádro OS nerozumí formátům souborů
	- soubory se typicky neukládají v paměti, ale na perzistentním úložišti
	- soubor je chápán jako unikátní číslo – kvůli lidem mají soubory jméno a cestu (aby v souborech nebyl chaos)
	- některé části názvu souboru (počáteční tečka, přípona) mají speciální význam (ale přípona souboru nemusí souviset s reálným formátem souboru)
	- operace se soubory – vyčištění cache, změna atributů, vytvoření, smazání
	- file handle – číslo specifické pro proces, odkazuje na konkrétní soubor (stdin, stdout, stderr mají handles 0, 1, 2)
	- buffering
		- cachování sektorů disku (když disk čtu po bajtech, první se načítá přímo z disku, všechny ostatní v daném sektoru už se pak načítají z cache)
		- existuje několik úrovní cache (systémová, language runtime)
		- sekvenční vs. náhodný přístup
	- alternativy – memory mapping, asynchronní přístup souborům
- adresář
	- kolekce souborů
	- význam – rychlejší hledání souboru, lepší navigace pro uživatele, logické seskupení souborů
	- obvykle reprezentován jako soubor
	- někdy v něm můžou být uloženy některé atributy jeho souborů
	- obvykle existuje kořenový adresář
	- operace – vytvořit, smazat, přejmenovat, najít název, vypsat soubory
- ukládání souborů
	- tradiční úložiště
		- na sekundárním nebo externím úložišti
		- file system in RAM (pro dočasné soubory)
	- síťové úložiště – soubory se tváří, jako by byly na disku, ale přitom jsou uloženy někde jinde na síti
	- virtuální soubory – např. /dev/null
- file links
	- links (hard links)
		- více adresářových záznamů odkazuje na stejný fyzický soubor
		- většina operací je transparentních
		- šetří místo, ale může dělat problémy (smazání hardlinku nesmí smazat fyzický soubor – takže OS musí počítat odkazy na daný soubor)
	- symlinks (soft links)
		- symlinky jsou speciální soubory, v nichž je uložená cesta jiného souboru
- file system
	- řeší překlad jmen, správu datových bloků, správu dat souborů
	- pro file system je jednotkou jeden blok, blok je určitý počet sektorů
	- řeší abstrakci práce se soubory a adresáři
	- může být lokální (FAT, NTFS) nebo síťový (NFS, CIFS/SMB)
	- práce s FAT bude u zkoušky :)
- File Allocation Table (FAT)
	- z doby MS DOSu
	- jedna struktura (FAT) spravuje volné bloky a uložení dat souborů
	- adresář je sekvence záznamů s pevnou délkou a atributy (počáteční blok, název + přípona, velikost, časy, …)
	- root je na fixní pozici
	- formát struktury
		- boot record
		- FAT1
		- FAT2
		- root directory
		- data
	- smazané soubory se označují speciálním bajtem (takže při mazání nepřepisuju data)
	- FAT je pole intů
		- velikost
			- FAT = FAT16 → inty jsou 16bitové
			- FAT32 → inty jsou 32bitové
		- pole je indexované od dvojky
			- nula má speciální význam
			- jednička je kořenový adresář
		- index v poli určuje offset bloku dat, kde je uložený obsah souboru
		- hodnoty položek v poli
			- nula = odpovídající blok je volný
			- ostatní hodnoty tvoří spoják (ten začíná záznamem v adresáři, hodnota na daném indexu odkazuje na další index…)
			- minus jedna označuje poslední blok souboru
		- nepoužívá se alokační strategie – hledám první volný blok
		- FAT se dnes obvykle vejde do paměti
		- spoják je jednosměrný – takže při náhodném přístupu k souboru musím spoják projít od začátku
- Second extended file system (ext2)
	- starý linuxový file system
	- s random access má podobný problém jako FAT
	- inode reprezentuje jeden soubor/adresář
	- inode je poměrně složitě zanořený, je tam daný pevný limit na velikost souboru
- rotační pevný disk
	- na ose je několik ploten
	- stopy (soustředné kružnice) se dělí na sektory
	- blok – stejný sektor na všech plotnách
	- cluster – stejná stopa na všech plotnách
	- flying height – vzdálenost mezi hlavou a plotnou
	- rotační rychlost – 5 až 15 tisíc otáček za minutu
	- přístup na sektor je docela dlouhý (v jednotkách milisekund)
	- rotační zpoždění – hlava na správný sektor čeká třeba 4 ms (pokud celá rotace trvá 8 ms)
	- disk access time = seek time + rotational latency + transfer time
		- transfer time je zanedbatelný (ve srovnání se zbylými dvěma hodnotami)
	- disk nestíhá odbavovat všechny požadavky operačního systému, takže je řadí do fronty, v disku je procesor, který se rozhoduje sám, jak je obslouží (dřív to rozhodoval OS)
	- trojice čísel – CHS (cluster, head = číslo plotny, sector)
	- disk scheduling algorithms
		- FCFS (First Come First Served)
		- SSTF (Shortest Seek Time First)
		- SCAN (aka Elevator algorithm) – zachovává směr (dokud je kam)
		- CSCAN (Circular SCAN) – jede jenom jedním směrem, na konci udělá seek zpátky na počáteční mez; časy seeků jsou rovnoměrnější
		- LOOK/CLOOK – jako scany, ale nenavštěvují kraje disku (dívají se, jestli tam jsou ještě požadavky)
		- FSCAN – má dvě fronty
- solid-state disk (SSD)
	- disk bez pohyblivých částí – jenom elektrické obvody
	- NAND flash – sestává z tranzistorů
	- má omezenou životnost na počet zápisů
	- mřížková struktura organizovaná po blocích stránek (pages)
	- vymazat se dá pouze celý blok najednou
	- „smazané“ stránky se nedají přepsat, dokud není celý blok vymazán
	- někdy se dělá to, že se plné stránky překopírují jinam, aby se blok mohl vymazat
- HDD partitioning (diskové oddíly)
	- dělení disku do několika logických disků – každý může mít vlastní file systém
- RAID (Redundant Array of Inexpensive Disks)
	- způsob propojení více pevných disků do jednoho
	- typicky na úrovní hardwaru, ale může být implementováno pomocí OS
	- hlavní cíl je zvýšení spolehlivosti a zrychlení přístupu
- virtuální paměť
	- instrukce procesoru pracují s virtuálními adresami
	- operační paměť má fyzické adresy
	- hardwarově je implementován převodní mechanismus
		- musí vyhodnotit, jestli existuje převod
		- zajistí přepočet, pokud existuje
		- tyto kroky musí být extrémně rychlé
	- existují dva mechanismy – segmentace (už se nepoužívá) a stránkování
	- MMU = Memory Management Unit, provádí převod
	- převod paměti je transparentní
	- výhody konceptu
		- větší adresový prostor – abych mohl spustit proces s většími požadavky na paměť
		- bezpečnost – aby si procesy navzájem nemohly koukat do paměti, každý má vlastní mapování; to je dnes ten hlavní důvod
	- segmentace
		- virtuální adresový prostor se dělí do logických segmentů
		- segmenty mají svoje unikátní číslo, velikost, začátek (kde ve virtuální paměti daný segment začíná) a vlastnosti (např. zda se od nich smí zapisovat)
		- adresa v paměti je dvojice – číslo segmentu a offset uvnitř segmentu
		- tabulka segmentů je v paměti – je to jednoduché pole indexované číslem segmentu, pro každý segment je v poli uložená datová struktura se všemi potřebnými informacemi o segmentu
		- data o aktivních segmentech se cachují
		- když se proces snaží přistoupit k segmentu, který neexistuje, tak najdu nějaký jiný segment, data v něm uložená schovám na disk (pokud je read-only, tak to nemusím dělat, protože jsou data uložená v původním exe souboru) a segment můžu použít
		- v případě chyby – segmentation fault
	- stránkování (paging) – používá se
		- virtuální adresový prostor (VAS) je rozdělen na stejné části (stránky, jejich velikost odpovídá mocninám dvojky)
		- fyzický adresový prostor (PAS) je rozdělen na stejné části (rámce, framy, mají stejnou velikost jako stránky)
		- VAS je jednorozměrný, instrukce pracují s jedním číslem
		- page table (stránkovací tabulka)
			- zajišťuje překlad adres
			- je to pole stránek (indexované číslem stránky)
			- každý záznam obsahuje číslo framu a atributy
			- je tam jednička/nula – aby se dalo určit, jestli stránka fyzicky existuje
			- v případě chyby – page fault
		- virtuální adresa se navenek jeví jako jedno číslo, ale protože velikost stránky je mocnina dvojky, tak část binárního čísla odpovídá číslu stránky a část offsetu
		- když mi dojde fyzická paměť, tak nějakou stránku uložím na disk – je to obvykle méně dat, než by to bylo při výpadku segmentu (segmenty měly různé velikosti, stránky jsou všechny stejně velké)
		- problémy s page table
			- velikost
				- 32-bit VA/PA, 4k paes/frames (12 bits)
					- jedna stránka = 4 bajty
					- počet stránek = $2^{20}$
					- takže 4 MB pro každý proces
				- nápad – víceúrovňové stránkovací tabulky
					- obvykle nepotřebuju celou tabulku
					- první úroveň tabulky je vždycky v paměti, další úrovně tam být nemusí
					- je to vlastně strom
					- může být výpadek stránkovací tabulky
			- rychlost
				- každý přístup do paměti znamená alespoň jeden další přístup do paměti
				- TLB (Translation Lookaside Buffer)
					- asociativní paměť (mapa)
					- cachuju převody mezi adresou stránky a framu
					- některé procesory nemají stránkovací tabulku, mají jenom TLB – tuhle logiku řeší OS
		- reálný příklad
			- 32-bit adresa
			- posledních 12 bitů určuje offset
			- číslo stránky rozdělím na dvakrát 10 bitů
			- každá část odpovídá jedné úrovni stránkování
			- prvních deset bitů použiju k indexaci do první tabulky
			- dozvím se číslo rámce tabulky druhé úrovně
			- použiju druhých deset bitů k indexaci do druhé tabulky
			- dozvím se číslo rámce dat, použiju offset a mám data
		- příklad (může být ve zkoušce)
			- 32bitové adresy
			- dvouúrovňové stránkování, 4KiB stránky
			- inty mají 4 bajty
			- sčítám dva tisíce intů do jednoho long longu
			- kolik page faultů maximálně může nastat?
			- čtu 8 000 bajtů, stránky mají 4 000
			- v nejhorším případě bude těch 8 000 sahat do tří stránek
			- můžou nastat tři výpadky stránek + nemusí existovat stránkovací tabulky druhé úrovně
			- stránkovací tabulka druhé úrovně pokrývá 4 MB
				- tudíž mi stačí jedna
				- ale v nejhorším případě se to nevejde do jedné, ale do dvou, takže můžou nastat dva výpadky
			- takže celkem pět výpadků
		- proces převodu adresy
			- vezmu adresu a rozdělím ji na číslo stránky a offset
			- vezmu číslo stránky a podívám se do TLB (pokud ho má → mám číslo rámce → slepím s offsetem → hotovo)
			- pokud ho TLB nemá, pokračuju dál – projdu stránkovací tabulky
			- v tabulce/TLB jsou dva příznaky
				- A (accessed) – přistoupil jsem tam
				- D (dirty) – něco jsem tam zapsal
			- aktualizuju ty příznaky podle reality
			- adresu slepím s offsetem, přistoupím k datům
			- když v tabulce není present bit, tak vrátím page fault
			- převod uložím do TLB
		- adresy přepočítává hardware (softwarově by to bylo pomalé)
		- v TLB jsou vždycky 3 bity – Accessed, Dirty, Present
		- připomenutí: fault vypadne před instrukcí × trap za instrukcí
		- page fault handling
			- zajišťuje OS
			- provádí se kontrola, jestli program sahá na adresu, kam má přístup
			- vytváří se mapování – hledá se volný rámec
				- pokud je paměť plná, tak se najde oběť (pomocí page replacement algoritmu) – pokud je dirty, tak se uloží; odstraní se mapping z TLB
			- opakuje instrukci
		- page replacement algoritmy (používají se u rámců, TLB, cachí…)
			- optimální algoritmus – pouze teoretický, nahradí stránku, ke které budeme přistupovat za nejdelší dobu
			- clock
				- rámce jsou organizovány kruhově
				- ručička ukazuje na rámec, který bude nahrazen
				- pokud má rámec nenulový Accessed bit, nastavím ho na nulu a posunu se dál
				- pokud ho má rámec nulový, tak ho nahradím
			- NRU (not recently used)
				- Accessed bit pravidelně nuluju
				- klasifikuju rámce podle jejich A, D bitů do čtyři tříd
					- A0, D0 … třída 0
					- A0, D1 … třída 1
					- A1, D0 … třída 2
					- A1, D1 … třída 3
				- použiju náhodný rámec z neprázdné třídy s nejnižším číslem
			- LRU (least recently used)
				- používá minulost k předpovědi budoucnosti
				- nahrazuje stránku, která nebyla použita nejdéle
				- HW implementace cachí nebo bitovou maticí
			- NFU (not frequently used)
				- bokem mám počítadlo pro rámec
				- jednou za čas vezmu A a přičtu ho k počítadlu a vynuluju A
				- vyberu frame s nejnižším počítadlem
				- problémy – nově přidané rámce jsou vyhozeny dříve, než nasbírají dostatek bodů v počítadle; rámce, které byly hodně používány nebudou nikdy vyhozeny
				- stárnutí – periodicky dělím počítadla (shiftuju)
				- když stránku namapuju, tak jí dám nějakou počáteční hodnotu do počítadla, aby nebyla hned eliminována
		- sdílená paměť
			- část virtuálního adresového prostoru je sdílená mezi procesy
			- ty používají sdílenou paměť ke komunikaci
		- paměťově mapované soubory
			- virtuální adresový prostor ukazuje do souboru
- virtualizace
	- VM – hypervisor zajišťuje virtualizaci hardwaru
	- virtualizace na úrovni OS

## Paralelní počítání

- chci zrychlit výpočet
- race condition
	- více vláken přistupuje ke sdílenému prostředku
	- to vede k tomu, že výsledek výpočtu závisí na plánování operačního systému nebo na chování procesoru
	- takový výsledek je k ničemu
	- řešila by to atomizace read-modify-write operace
	- definuju kritickou sekci
	- pomocí synchronizačního primitiva zajistím, že v kritické sekci je jenom jedno vlákno
	- aktivní a pasivní/blokující synchronizační primitiva
		- aktivní vykonávají instrukce a pořád koukají do kritické sekce, jestli tam můžou
		- pasivní/blokující jsou zablokovány, dokud není přístup povolen
	- hardwarová podpora – atomické instrukce test-and-set (TSL), compare-and-swap (CAS)
	- spin-lock
	- semafor

## Zkouška

- nezávislá na zápočtu
- test u počítače v laborce – musíme se zapsat v SISu
- nepotřebujeme vůbec nic – ale máme si vzít prázdné papíry a tužku + můžeme si vzít kalkulačku (nebo si pustíme na počítači)
- stačí nám znalosti z přednášky
- 10 otázek
- některé čistě teoretické
	- jedna správná odpověď (zaškrtnout)
	- několik správných odpovědí
- další otázky počítací (je jich 5)
	- page faults
		- pozor na rozdíl mezi čtením a kopírováním
		- při kopírování jich vypadne 8 (úloha viz prezentace)
	- struktura (struct) – vnější a vnitřní zarovnání, počítání offsetu
	- FAT (odpověď: 10, 15)
	- vybrat kód
	- Jedná se o alokaci souvislých bloků paměti. Máte zadaný typ algoritmu pro alokaci (např. first fit) a sekvenci alokací a dealokací bloků různé velikosti. A otázka pak zní: Na jaké adrese leží nějaký blok na heapu, pokud byl použitý daný algoritmus?
	- ale můžou tam být i jiné otázky
- je na to zhruba hodina (ale klidně dvě hodiny)
- odpovědi musí být správné, na postupu nezáleží
- v češtině i angličtině