Principy počítačů

1. přednáška 2. přednáška 3. přednáška 4. přednáška 5. přednáška Ambient Light Sensor (ALS)6. přednáška 7. přednáška 8. přednáška 9. přednáška 10. přednáška 11. přednáška 11,5. přednáška 12. + 12,5. přednáška 13. přednáška

https://slama.dev/poznamky/principy-pocitacu/
písemná zkouška, 10 otázek, každá za jeden bod, potřebujeme polovinu na úspěšné složení zkoušky, časový limit 4 hodiny, zkouší se s toho, co se probere na přednáškách, dostaneme ukázku (loňskou písemku)
self-assessment úlohy – dostaneme ke každé přednášce sadu
- za nějaké odevzdané úlohy můžeme dostat desetinu bodu ke zkoušce, až něco přes dva body budeme moci získat, týdenní deadliny
- hodnocení úloh bude až dodatečně, pokud bychom ty body potřebovali
- zadávání a odevzdávání úloh do MS Teams
videozáznamy nám pošle
důležité je pochopit, proč věci fungují tak, jak fungují – nemusíme se učit všechno nazpaměť, ale musíme umět termíny
nemusíme se hlásit, když se na něco budeme chtít zeptat

1. přednáška

Harvardská architektura počítače
- CPU – procesor, vykonává příkazy
- kódová paměť (code memory) – uložení informací o příkazech
- komunikační linka – umožňuje, aby procesor četl data z paměti
  - v základním počítači CPU nemusí zapisovat do kódové paměti, do ní se zapisuje nějak z venku
- datová paměť (data memory) – CPU z ní čte a zapisuje do ní data
  - data se ukládají do proměnných
- k procesoru jsou dále připojena vstupně-výstupní zařízení – I/O, periferie
matematik Charles Babbage vymyslel koncept mechanického počítače – Analytical Engine (v roce 1837), byl plně programovatelný, Turing complete
- jeho přítelkyně Ada Lovelace napsala manuál k tomuto počítači
  - vydala publikaci, kde vyslovila myšlenku kódování libovolných dat (textů a multimédií) pomocí čísel
budeme se zabývat tím, jak v počítači reprezentovat čísla (všechna ostatní data na ně můžeme převést)
- informace (data) → čísla → celá čísla → nezáporná celá čísla
zaznamenáme libovolné číslo od nuly do milionu
- nula je 0 V, miliion je 5 V, všechno ostatní mezi tím
- problém je při vysílání, každý vodič má odpor
  - změna odporu při teplotě
  - kvůli vlastnostem vodičů vzniká elektromagnetický šum
  - analogový přenos
posledním zjednodušením je přenášení čísel nula/jedna
- této číslici budeme říkat bit (binary digit), b
- stanovíme hranici napětí, všechny hodnoty nad ní budeme interpretovat jako jedničku, hodnoty pod ní jako nulu
- digitální přenos – přenos číslic

timing-diagram

sériový digitální přenos
- záleží na pořadí číslic – přijímající a vysílající se musí dohodnout
  - označíme si bit s nejnižší váhou – Least Significant bit (LSb)
  - bitu s nejvyšší váhou budeme říkat Most Significant bit (MSb)
  - stanovíme bit order – MSb-first nebo LSb-first
mocniny dvojky
- 16 = 2^4
- 256 = 2^8
- 1024 = 2^10
- 4096 = 2^12
- 65536 = 2^16
- cca 10^6 = 2^20
- cca 16 000 000 = 2^24
- cca 4 200 000 000 = 2^32

diferenciální přenos
- data 1 – data 2
- >0 = 1
- <0 = 0
řešení problému se dvěma jedničkama / dlouhou jedničkou
- pevná délka bitu
  - definuje se přenosová rychlost
    - v bitech za sekundu (bits per second, bps)
    - jednotka baud [bód] (symbol za sekundu) – obvykle budeme uvažovat x baud = x bps, ale jeden symbol může obsahovat více bitů

2. přednáška

vodiče
- klasický způsob přenosu (není diferenciální) – data a GND
- diferenciální – data+, data–
přijímač se na signál kouká přibližně v polovině bitů
- přenosová rychlost zajišťuje intervaly čtení, je ale nutné zajistit začátek čtení (synchronizaci hodin, "tikání")
- musíme si odlišit stav, kdy se nic nepřenáší, od začátku přenosu
idle stav – nic nepřenášíme
floating stav / stav s vysokou impedancí / Hi-Z = stav, kdy je obvod rozpojený, ale vodič indukuje náhodnou hodnotu
3-stavová logika – funguje na lince, kde umíme rozlišit floating stav, nulu a jedničku
- floating stav bychom mohli požadovat za idle stav
my ale chceme fungovat na 2-stavové logice (lince)
- můžeme definovat idle stav jako nulu
- začátek přenosu označíme pomocí start condition – rising edge (rostoucí hrana)
- definujeme si, že na začátku přenosu bude start bit (nebo nějaký určitý počet start bitů)
- potom začíná přenos užitečných bitů (datových bitů / data bits)
  - data bits se do obrázku značí podobně jako diferenciální přenos, ale znamenají něco jiného (jde o obecné značení bitů, jaké je možné posílat)
může se stát, že se nám vysílání a příjem bitů posune
- proto definujeme maximální délku přenosu – max X → const X (definujeme konstatní maximální délku)
- N bitů celkem rozdělíme po X bitech
  - N/X = Y přenosů
- výrobci se shodli, že se přenos bude uskutečňovat po 8 bitech
  - 8 bitů = 1 byte (B)
  - 8 bitů = 1 octet (existuje několik málo zařízení, která mají jinou velikost bytu, proto je obecně správnější používat označení octet)
po X bitech (obvykle osmi, ale může být i více bytů) – stop condition (falling edge, klesající hrana), stop bity, idle stav, start condition, start bity, ...
takhle navržená linka přenáší 20 % času technická data (8 data bits, 1 start bit, 1 stop bit) – 20% overhead
přenosová rychlost bps (bits per second) – počítají se data bits
synchronizaci je možné řešit i pomocí hodinového signálu (clock) – linka vysílající střídavě nuly a jedničky, jednička značí čas čtení (zajišťuje synchronizaci přijímače a vysílače)
- vodiče
  - data, GND, clock
  - diferenciální – data1, data2, clock, GND, (clock1, clock2) (?)
- přenosová rychlost by mohla být definovaná rychlostí tikání hodinového signálu
- hodinový signál může generovat vysílající – určité nevýhody
- hodinový signál může generovat centrální oscilátor
- cyklus (cycle/takt) hodinového signálu definuje přenosovou rychlost
- lépe se detekují hrany signálu – můžeme si definovat, že rostoucí hrany hodinového signálu definují momenty čtení
- abychom zrychlili přenos, můžeme používat obě hrany hodinového signálu (rostoucí i klesající) – označení DDR (double data rate)
co když je hodinový vodič kratší než datový vodič?
- můžeme se vykašlat na hodiny a synchronizovat se jiným způsobem – vždy jen v určitých (delších) intervalech
- mohli bychom se synchronizovat pomocí hran, ale museli bychom mít jistotu, že se v datech dostatečně často střídají jedničky a nuly – to ale nemusí vždy platit
- na každých osm bitů bychom mohli poslat 10 bitů
- ke každé kombinaci osmi bitů bychom mohli namapovat kombinaci 10 bitů, které jsou dostatečně "hezké" – dostatečně často se tam střídají jedničky a nuly
- přijímač i vysílač má mapovací tabulku
- tento způsob synchronizace se nazývá clock recovery, používá se např. v USB
  - vodiče v USB: 5 V, GND (tyto dva slouží k napájení připojeného zařízení), data+, data– (tyto dva zajišťují přenos dat)
  - zbylé dva způsoby synchronizace přenosu používají linky I²C (pomocí hodinového signálu) a RS-232 (pomocí start a stop bitů)
linky simplex a duplex
- přenos jedním směrem – simplex
- přenos oběma směry – duplex
  - half-duplex – strany se musejí domlouvat, kdo zrovna posílá
  - full-duplex – nezávisle data přenášíme oběma směry → řešení pomocí dvou zcela nezávislých simplexních linek
    - např. RS-232
      - Rx – přijímající vodič (receiver)
      - Tx – vysílající vodič (transmitter)
      - dále se definují out-of-band signály
        
        přenášejí se tam informace nezávisle
        
        obvykle přenášejí konstatní nulu nebo jedničku – signál platí/neplatí
běžné kódování – 0 = nepravda, 1 = pravda
- power-out signál
  - někdy dává smysl to definovat obráceně – 0 = platí, 1 = neplatí → inverzní logika
    - obvyklá značení inverzní logiky na signálu SIG: SIG (s čárou nad textem), #SIG, /SIG, !SIG, SIG (bílé písmo na černém pozadí)
hodiny reálného času – RTC
- chceme, aby nám zařízení poslalo tři informace – den, měsíc a rok
  - třeba 9 bitů na den, 5 bitů na měsíc, 7 bitů na rok
- musíme si definovat, jak bude která informace dlouhá
- komunikační protokol/formát
- jeden logický blok dat = packet (tento packet by měl 21 bitů)
- musíme se dohodnout na MSb-first / LSb-first
- délka packetu nemusí být pevná, délka packetu může být definovaná uvnitř packetu
řadič (controller) – zařízení, které zajišťuje ovládání linky (procesor → linka → řadič → linka → myš)
- uvnitř je registr daného zařízení – data register
- komunikace s řadičem z programu – musím mu říct, jak má interpretovat změny na datovém vodiči, který jde z myši
  - pomocí pyserial → serial → Serial
  - nastavení řadiče (config register)
  - status register – ukládá informaci, v jakém stavu je datový registr (např. 0 = no change, 1 = new byte in data register)
    - operace přečtení data registru zaznamená do status registru nulu
- funkce, které komunikují se zařízeními, mají často nějaký timeout, aby čekání na data nebylo nekonečné

3. přednáška

řadič řeší komunikaci programu s myší a překlad ze sedmibitových na osmibitové bajty
sériovou myš také potřebujeme nějak napájet
- běžně v USB konektoru jsou 4 piny, z toho dvoje data, zem a napájení
- kvůli kompatibilitě se sériová myš připojovala pomocí RS-232 linky
- RS-232 nemá napájecí konektor, ale pouze out of band signály
- sériová myš je tedy napájená pomocí out of band signálů RTS a DTR nastavených na hodnotu 1
- v řadiči je control register (modem control register) – pro každý out of band signál je tam jeden bit, který má hodnotu 0 (false) nebo 1 (true)
- jak resetovat myš? stačí nastavit signály RTS a DTR na nulu → myš se po chvíli vypne → můžeme myš opět zapnout
- (nemusíme si pamatovat, že to jsou zrovna RTS a DTR)
po zapnutí myš pošle inicializační packet (init packet) – není přesně definován
- po zapnutí myši tedy čekáme na X (třeba 1024) bajtů
- čekáme pomocí funkce .read(n), tato funkce je ale blokující
- ideální by byla neblokující funkce
- řešením je nastavení timeoutu
potřebujeme být schopni stisknout klávesu na klávesnici a začít dělat něco jiného
- input() – blokující funkce
- keyboard.is_pressed('<key>') → True/False – neblokující funkce
přijímání dat z myši
- bity jsou zprava doleva seřazeny 0–7 (podle zápisu čísla ve dvojkové soustavě)
- myš posílá 7 bitů, takže MSb je pro ni bit č. 7
- stisknutí levého tlačítka → packet 96 0 0 0
  - 96 = 64 + 32 = 2^6 + 2^5 → 01 10 00 00 (01 LR YY XX)
co dělat s informací 738201600
- šestnáctková/hexadecimální/hexa/hex soustava
- značení čísla v šestnáctkové soustavě: $23, 23h, 0x23,$ 23_{16} $,$ 23_{hex}$
- značení čísla v desítkové soustavě: $23_{10}, 23_{dec}$
- pro uložení jedné číslice v šestnáctkové soustavě využijeme 4 bity
- 1 bajt zaberou dvě šestnáctkové číslice
- nuly na začátku čísla = leading zeros
- $738201600_{10} =$ $73820160 0_{10} =$ $2C001000 → 2C 00 10 00 → nenulové bity jsou pouze na některých místech
  - bity 29, 27, 26 a 12 jsou jedna
čísla zadané v Pythonu v desítkové soustavě se ukládají ve dvojkové soustavě
proměnou lze uložit v šestnáctkové soustavě, Python ji opět uloží ve dvojkové soustavě → není rozdíl mezi 35 a 0x23
funkce print(a) vezme dvojkovou proměnnou a převede ji na string
znaky stringu jsou uloženy pomocí osmibitových čísel
funkce hex(a) vrací zápis čísla v šestnáctkové soustavě
funkce format(a, '04X') doplní číslo o leading zeros na 4 číslice
modifikovaný kód
- packet 60 00 00 00 → první byte 01 10 00 00
proč má první byte v 6. bitu jedničku?
- abychom ho poznali od ostatních tří bytů a nedošlo ke špatné synchronizaci snímání komunikace myši
bitové operace – obvykle dva argumenty (binární operace)
- n-bitová operace (např. osmibitová – podle délky každého ze dvou vstupů a délky výstupu)
- 8-bit operace – na vstupu dvě osmibitová čísla, na výstupu jedno osmibitové číslo
- operace vždy vezme dva bity na stejné pozici, nějakým mechanismem je zkombinuje a výsledek uloží do bitu na téže pozici
- operace or: 1010 | 1100 = 1110
  - můžeme kombinovat hodnotu a příkaz – jednička v příkazu znamená natvrdo nastavit výsledek na jedna, nula v příkazu znamená zkopírovat hodnotu do výsledku
  - nastavení bitu (na jedna) se označuje jako set
- operace and: 1010 & 1100 = 1000
  - když je příkaz nula → nastav natvrdo nulu
  - když je příkaz jedna → zachovej hodnotu
  - vymazání bitu – clear (to 0)
- bitová negace not ~
  - ~ 1010 = 0101
  - v Pythonu funguje jinak
- operace xor (eor)
  - exkluzivní or
  - 1010 ^ 1100 = 0110
  - selektivní flip (not)
    - když je jednička, převrať hodnotu
    - když je nula, zkopíruj hodnotu
jak zjistit, jestli je levé tlačítko stisknuté
- použijeme bitovou masku
- na ?? L? ?? ?? použijeme masku 00 10 00 00 a operaci and
- dostaneme buď 00 00 00 00 → tlačítko není stisknuté, nebo 00 10 00 00 → tlačítko je stisknuté
- B1 (byte 1) & 0x20 = 0x20 → levé tlačítko je stisknuté
pohyb myši
- kvůli přesnosti chceme použít 8 bitů, v jednom bytu je ale jenom 6 volných míst (máme 7bitový byte a bit č. 6 určuje pořadí bytu)
- informaci tedy rozdělíme 1. a 2. bytu
  - B1 & 0x03
  - B2 & 0x3F
  - chceme ze dvou čísel 000000XX a 00XXXXXX dostat XXXXXXXX
    - použijeme magii a převedeme 000000XX → XX000000
    - XX000000 | 00XXXXXX = XXXXXXXX

4. přednáška

potřebujeme magickou operaci, která nám umožní posunout bity
- = bitové posuny (bitwise shifts)
- posun doleva (shift left) – SHL (<<)
  - a << x → b
  - a – hodnota, se kterou chceme pracovat (n-bitové číslo)
  - b – výsledek operace (n-bitové číslo)
  - x – o kolik bitů se má posunout (celé číslo)
  - posun k MSb!
  - příklad
    - 4-bit 1101 (vlevo MSb, vpravo LSb)
    - SHL 1 → výsledek: 1010
      - o jedničku úplně vlevo jsme přišli, vpravo přibyla nula
    - SHL 3 → výsledek: 1000
    - SHL n → výsledek: 0000
- posun doprava (shift right) – SHR (>>)
  - a >> x → b
  - funguje podobně jako SHL, akorát opačně
  - posun k LSb
- rotace doleva (rotate left) – ROL
  - 1101 ROL 3 → 1110 (vysunuté bity nerušíme, ale ve stejném pořadí zasuneme z druhé strany)
  - výsledkem ROL n je identita
- rotace doprava – ROR
  - 1101 ROR 2 → 0111
- rotace Python nepodporuje
potřebujeme rozlišit posun myši nahoru a doleva → záporná čísla ve formě jedniček a nul
- bezznaménková čísla (unsigned)
- znaménková čísla (singed)
  - signed magnitude – 1 bit určuje znaménko, ostatní bity hodnotu čísla
    - z hlediska kompatibility je výhodné umístit znaménkový bit na místo MSb, přičemž 1 určuje záporné číslo, 0 kladné
    - při počítání pouze s nezápornými čísly ztrácíme polovinu rozsahu, takže se v takovém případě může hodit použít bezznaménková čísla
  - každý procesor podporuje operace pro bezznaménková čísla
    - můžeme libovolně přecházet mezi interpretací čísla jako znaménkového a bezznaménkového
    - nefunguje nám bezznaménkové porovnání na porovnávání záporných čísel (ani sčítání apod.)
  - jedničkový doplněk (ones' complement)
    - kladná čísla jsou zaznamenaná stejně jako unsigned
    - záporná jsou zaznamenaná znegovaně
  - jak udělat z kladného čísla záporné?
    - u signed magnitude pomocí operace XOR
    - u jedničkového doplňku negací
  - problém s nulou
    - máme dvě nuly – kladnou a zápornou
    - u jedničkového doplňku můžeme negovat a přičíst jedničku → dostaneme zpátky nulu
  - dvojkový doplněk (two's complement)
    - kladná čísla jako unsigned
    - záporná čísla jsou negace absolutní hodnoty plus 1
    - rozsah –128 až 127
    - nefunguje porovnání mezi kladnými a zápornými čísly – procesor musí podporovat znaménkové porovnání
    - MSb určuje znaménko
    - nejběžněji používaná implementace záporných čísel
Python ke každému číslu ukládá počet platných bitů, ukládá je jako znaménková čísla
- jejich rozsah je prakticky neomezený
- při posunech (<< a >>) nikdy nepřijdu o číslice – Python si čísla před operací zvětší odpovídajícím způsobem
- funkce bit_length() vrací bitovou délku čísla (bez znaménkového bitu)
- knihovna numpy nám umožní vyrábět proměnné pevně daných typů (uint8, uint16, int8, …)
  - čísla intX jsou znaménková, takže tam mj. funguje porovnání
- funkce type(x) nám vrátí typ čísla
převod 8-bit čísla na 4-bit
- operace truncation, přebytečné bity se zahodí – v podstatě $x \mod 2^n$
- u čísel blízko nuly funguje dobře, u vzdálenějších čísel získáváme modulo
převod 4-bit čísla na 8-bit
- bezznaménkové rozšíření (zero extension) – na začátek se přidají čtyři nuly, nefunguje pro znaménková čísla
- znaménkové rozšíření (signed extension) – rozkopíruje znaménkovou číslici do nových bitů, nefunguje pro bezznaménková čísla
- v Pythonu se bezznaménkové rozšíření používá jenom při převodu mezi dvěma bezznaménkovými čísly, jinak se používá znaménkové rozšíření

5. přednáška

Harvardská architektura – CPU čte z kódové paměti, čte z datové paměti a zapisuje do datové paměti
- datové paměti můžeme říkat operační paměť (operating memory)
- periferie komunikují s CPU jednosměrně nebo oběma směry (monitor posílá informace o rozlišení, klávesnice přijímá informace o rozsvícení diod)
zařízení
- master – řídí přenos (řídící – řídí komunikaci)
- slave – poslouchá (řízený)
- při komunikaci procesoru s pamětí je procesor master, paměť je slave
- když data proudí směrem master → slave, tak jde o zápis, opačným směrem je to čtení
- typický procesor funguje jenom jako master – abychom toto pravidlo neporušili, používáme řadič
  - řadič je potřeba u myši, u klávesnice tato potřeba obvykle není, protože se chová jako slave (uvnitř má vlastní registr)
komunikační linka point-to-point – z procesoru by muselo vést mnoho vstupů/výstupů
chceme komunikační linku, která umožňuje více vstupů/výstupů – multidrop/bus/sběrnice (linka se sběrnicovou topologií)
nákres – z CPU vedou dvě sběrnice, na jedné jsou připojené paměti, na druhé perfiferie (myš za řadičem), CPU je master, všechno ostatní slave
adresa (address) zařízení na sběrnici (typicky 0 až n)
- v příkazu v programu pro procesor budou dvě informace – chci komunikovat se zařízením X na sběrnici Y
- adresy zařízení musí být unikátní v rámci jedné sběrnice
- rozsah adres (address space)
- máme X bitový adresový prostor → platné adresy jsou $0$ až $2^x-1$
- někdy i master musí mít vlastní adresu?
zařízení je připojené na sběrnici
- má Rx a Tx – může přijímat i vysílat data
- je tam víc zařízení, zkusíme se obejít bez floating stavu
- k lince připojíme 5 voltů přes rezistor s velkým odporem (pull-up rezistor, kdyby tam byla nula voltů, tak by to bylo pull-down rezistor)
- když není žádné zařízení připojené k lince, tak je stav linky 1 (protože je tam těch pět voltů za rezistorem)
- zařízení je připojené, ale nedělá nic → nepřipojí se ke sběrnici´→ stav linky je 1
- zařízení je připojené a vysílá jedničku → nepřipojí se ke sběrnici → stav linky je 1
- zařízení je připojené a vysílá nulu → připojí se (na malém rezistoru v zařízení na Tx je 0 V) → stav linky je 0

D1	D2	bus
x	x	1
x	1	1
x	0	0
1	1	1
1	0	0
0	1	0
0	0	0

spodní čtyři řádky implementují AND
$I^2C$ $I^{2} C$ – Inter Integrated Circuit
- vodič SDA – sériová data
- vodič SCL – sériové hodiny
- oba vodiče posílají digitální signál
- oba vodiče jsou připojené na pull-up rezistor
- napájecí napětí se označuje jako $V_{DD}$ nebo $V_{CC}$
- pod 30 % $V_{DD}$ se považuje za nulu, nad 70 % za jedničku
- multimaster – různá zařízení můžou být master
  - existují i singlemaster sběrnice – např. USB
- musíme rozeznat idle stav od přenosu
  - SCL tiká jenom během přenosu, generuje ho master
  - dvě jedničky (na SDA i SCL) znamenají idle stav
  - na lince existují nepovolené stavy – např. změna stavu na SDA při jedničce na SCL – toho využijeme jako START a STOP condition
    - START condition = sestupná hrana na SDA při jedničce na SCL
    - STOP condition = vzestupná hrana na SDA při jedničce na SCL
- sběrnice má 9-bitové byty: 8 data bit + 1 control bit
  - kontrolní bit (acknowledgement/potvrzovací/ACK bit)
    - (acknowledgement = ACK × negative acknowledgement = NACK/NAK)
  - první byte vždycky posílá master, slave ho potvrzuje kontrolním bitem
  - další byty posílá vysílající a přijímající potvrzuje (pokud přijímající přestane potvrzovat, vyhodnotí se to jako NAK)

	B1	a1	B2	a2	B3	a3
write	M	S	M	S	M	S	NAK
read	M	S	S	M	S	M	NAK

MSb-first komunikace
série bytů tvoří packet, ten se dělí na overhead ( $I^2C$ control) a payload (device specific – požadovaná data)
$I^2C$ $I^{2} C$ sestává ze slave address (7-bit) a bitu určujícího směr přenosu $R/\bar W$ $R / \overset{ˉ}{W}$
- read = 1, write = 0
- devátý control bit má obrácenou logiku – 0 = ACK, 1 = NAK (typicky pokud tam slave není)
když slave nestíhá, tak může v hodinovém signálu generovat nulu → master ví, že nemůže posílat další data – tomu se říká clock stretching / hold clock low

Ambient Light Sensor (ALS)

ve smartphonu určuje intenzitu okolního světla a podle toho se určuje intenzita podsvícení
v datasheetu najdeme informace o fungování
zařízení má čtyři piny – VDD (napájení), GND (zem), SDA (data), SCL (hodiny)
v zařízení bude senzor a logika
součástí logiky je counter register – zajišťuje počítání intenzity světla
měření v intervalech (na začátku měření se counter vynuluje)
příkazy start integration a stop integration
- command register (cmd reg)
při extrémních hodnotách lze softwarově prodloužit/zkrátit dobu měření, abychom vůbec něco naměřili (to zajišťuje procesor zařízení)
counter register = ADC register (analog digital converter)
- existuje také DAC (digital analog converter) – opačný proces, z digitálního signálu se generuje např. analogová intenzita světla
- v ALS má 2 byty – z toho 15 datových bitů a jeden valid bit
připojení na sběrnici zajišťuje bus interface – skrze něj máme jako programátoři přístup k registrům
- write-only register (W/O)
- read-only register (R/O)
- read-write register (R/W) – v ALS nenajdeme
- v případě ALS bude „zápis“ znamenat zápis do W/O cmd registru a „čtení“ bude znamenat čtení z R/O counter registru
- adresa zařízení na sběrnici je pevně daná výrobcem – hardwired/zadrátovaná, v tomto případě je to $29 – na jednu sběrnici tedy nemůžu připojit dvě stejná zařízení, protože by měla stejnou adresu
u vícebytových čísel se rozlišuje LSB (byte s LSb) a MSB (byte s MSb)
kromě bit order se určuje byte order

6. přednáška

nechceme pokaždé přenášet celý obsah paměti
každému bytu přiřadíme adresu (n-bit unsigned), definujeme si paměťový adresový prostor
u 256 bytové paměti budeme mít 8-bitový adresový prostor (0 až 255 $\dots 2^8-1$ )
můžeme mít 200 bytovou paměť s 8-bitovým adresovým prostorem (podobně můžeme mít 256 bytovou paměť s 16-bitovým adresovým prostorem)
použití většího prostoru znamená možnost budoucího rozšiřování paměti
nechceme pracovat s velkými čísly – místo bajtů použijeme kilobajty
1 kB = 1024 B, 1 MB = 1024 kB, … (pro přehlednost se používají zkratky KiB, MiB, GiB → kibibyte, …)
- výrobci disků používají 1 kB = 1 000 B
pro uložení adresy bytu v KiB potřebujeme 10-bitovou adresu, pro adresování KiB v MiB také 10-bit, takže u GiB adresujeme konkrétní byte pomocí 30-bitové adresy
u adres bytů v KiB potřebujeme 10-bitovou adresu, ale binárně to vychází na 16-bit, takže takto můžeme adresovat 64kB médium
u 24-bitového prostoru 16 MB
u 32-bitového prostoru 4 GB
bity v registru řadiče: 1 bit → 1 latch (4–6 tranzistorů)
- nejrychlejší způsob uložení do paměti
- SRAM (Random Access Memory)
  - charakteristické vlastnosti
    1. umožňuje volbu adresy
    2. jednotná rychlost (uniform speed)
      - dnešní paměti RAM tohle většinou nemají
  - nejrychlejší přístup – sekvenční (postupný přístup k rostoucím adresám)
  - nejpomalejší – random (nelze předvídat, kam budeme přistupovat)
  - sekvenční přístup ke klesajícím adresám – záleží na konkrétní paměti
  - další vlastnost tohoto typu paměti je schopnost čtení a zápisu
  - typická vlastnost pamětí RAM – jsou volatile (po vypnutí napájení se ztrácí obsah)
    - kódová paměť počítače by tedy měla být non-volatile
  - kapacita – v jednotkách B, kB, MB
  - nevýhody – cena, rozměry
paměti DRAM
- základní vlastnosti odpovídají SRAM
- bit se ukládá pomocí 1 tranzistoru a 1 kondenzátoru
- D v názvu znamená dynamic
- nabité kondenzátory se postupně vybíjejí do vybitých
  - cca po milisekundě se náboje vyrovnávají
- refresh paměti – součástka se podívá na náboje a obnovuje jejich původní hodnoty (v tuto chvíli do paměti nemůže nikdo přistupovat)
- DRAM je tedy pomalejší než SRAM
přenosová rychlost – nejvíce ovlivňuje sekvenční přenosy, u SRAM 10 až 100 GB/s, u DRAM 1 až 10 GB/s
access time – u SRAM jednotky ns, u DRAM desítky ns
u naší 256 bytové paměti kódujeme adresu na I2C pomocí tří proměnlivých bitů
- pevný začátek adresy, za něj se přidávají hodnoty tří bitů
1 slovo (1 word) – jednotka přenosu/zpracování
- je pro nás důležitá velikost slova
- čím větší slovo, tím rychlejší přenos
- n-bit device (paměť)
- n-bit CPU (procesor umí pracovat s n-bitovými čísly)
adresa z pohledu CPU – adresa bajtu
u 16-bitové paměti tvoří dva bajty jedno slovo – používá adresy slov
podobně u 32-bitové paměti
adresy tedy musíme překládat
nesprávný význam slova: slovo = 16 bitů
dvojslovo (double word / DWORD / DW) – dvojnásobek slova (často 32 bitů)
čtyřslovo (quad word / QWORD / QW) – čtyřnásobek slova (v praxi často 64 bitů)
obsah naší paměti
- bus interface – I2C sběrnice, tři připojené vodiče určují adresu paměti
- adresový registr – velikost odpovídá velikosti adresového prostoru
  - ovládá logiku paměti
- datový registr – velikost odpovídá velikosti slova
- na I2C: 100 kHz → 100 000 b/s → 12 500 B/s
  - na jeden bajt se přenese 3×9 bitů
  - → 3 708 B/s
- můžeme předpokládat, že po zapsání bytu budeme chtít zapsat na ten za ním, tedy adresový registr inkrementujeme o 1
  - takhle dostaneme (u nekonečného přenosu) rychlost 11 109 B/s
- 1 write tx (transakce) = 1 I2C tx
- 1 read tx = 2 I2C tx (1 write do addr reg + 1 read z data reg)
- obecně jsou ale typické paměti RAM rychlejší na čtení než zápis
registrový adresový prostor zařízení – když má zařízení více registrů, ke kterým chceme přistupovat

7. přednáška

Harvardská architektura
- CPU
- data memory – implementujeme pomocí RAM (y-bit)
- code memory – sice problém s volatilitou, ale taky implemementujeme pomocí RAM (x-bit)
- sběrnice s připojenými řadiči a zařízeními
packety pro komunikaci s paměťmi generuje procesor
instrukce procesoru
- každý procesor má od výroby definovanou instrukční sadu (instruction set), kterou podporuje
- jedna instrukce je posloupnost N bajtů v kódové paměti (délky se můžou, ale nemusí lišit – podle procesoru)
- v paměti jsou uloženy za sebou, procesor je vykonává směrem k vyšším adresám
- procesor si musí pamatovat, kterou instrukci právě vykonává
  - k tomu slouží registry procesoru
  - nejzákladnější registr obsahuje adresu instrukce, která se právě vykonává – obvykle se mu říká program counter (PC) nebo instruction pointer (IP; přičemž pointer = ukazatel = adresa)
- vícebytová instrukce
  - instruction pointer ukazuje na base address (nejnižší adresa z toho rozsahu bytů)
  - dává smysl určovat u bajtů, jak jsou daleko od base address – říká se tomu offset (0 u bytu s base address, u dalších bytů 1, 2, 3, …)
- po vykonání instrukce se k IP přičte délka instrukce
- instrukce se obvykle skládá z několika částí
  - jednoznačný identifikátor instrukce – opcode (operační kód)
    - např. 105 = ADD (+), 106 = SUB (–)
  - zbytek tvoří argumenty instrukce
    - argumenty můžou být implicitní – např. přičti jedničku, je to napevno dané typem instrukce
- IP je x-bitový, ukazuje do kódové paměti
- proměnné (argumenty) u instrukcí jsou y-bitové, ukazují do datové paměti
- posloupnosti instrukcí se říká strojový kód (machine code)
program v Pythonu
- uložený jako text – posloupnost bytů (1 byte = 1 znak)
- můžeme mít program – překladač (compiler), který jako vstup přijímá text pythonového programu a jako výstup generuje posloupnost bytů (strojový kód)
- magicky přesuneme výsledek z data memory do code memory a zařídíme, aby ho procesor začal vykonávat
- vytvořit překladač je těžké
- může existovat také interpret (interpreter)
  - prochází text programu a zpracovává ho podle sady podmínek ve strojovém kódu
- interpret se píše snáz než překladač
v programovacím jazyce je proměnná identifikovaná jménem, kdežto ve strojovém kódu adresou
- překladač musí zařídit, aby proměnné alokoval na volných pozicích
jak do paměti uložit vícebytovou hodnotu
- endianita (endianness)
- viz Gulliverovy cesty
- little endian (LE) – na nejnižší adresu ukládám LSB
  - pravidlo LLL (least significant byte, lowest address, little endian)
- big endien (BE) – na nejnižší adresu ukládám MSB
- je důležité ujasnit si endianitu – má ji danou procesor, dnes je nejběžnější LE (některé mobilní procesory jsou BE)
  - problém nastává, když použijeme externí zdroj dat – tam musíme endianitu řešit a případně přeházet pořadí bytů
  - po síti se data většinou posílají v BE pořadí
code memory by měla být non-volatile
- nevýhody non-volatile pamětí
  - jsou pomalejší
  - mají omezený počet zápisů (opotřebovávají se)
- → proto nemůžeme non-volatile paměť použít pro data memory
je těžké zařídit přemístění programu z data memory do code memory, interpretovat veškerý kód by bylo zase neoptimální → řešením je jiná architektura
von Neumannova architektura
- operační paměť, kde je obojí – v jedné části kód programu, v jiné části data programu
  - zajistíme, aby IP obsahoval adresy z určitého rozsahu a aby adresy proměnných byly zase z jiného rozsahu
  - je to hardwarově komplikovanější na implementaci, ale přináší to spoustu výhod
  - lze zařídit, aby IP ukazoval na začátek přeloženého programu
  - potenciální zranitelnost, pokud útočník do dat určených ke čtení uloží spustitelné byty a zařídí jejich spuštění
  - operační paměť bude volatile – RAM
    - potřebujeme jiné magické zařízení, které do RAM zkopíruje počáteční program z non-volatile paměti
historie počítačů (prezentace) – všechny architektury jsou von Neumannovské
- UNIVAC – drahý, pro velké firmy na počítání mezd (byl to sálový počítač, prodalo se jich cca 100)
- Altair 8800 – první malý počítač, pro „matfyzáky“
  - Bill Gates a Paul Allen napsali překladač Microsoft BASICu, aby Altair mohla používat širší veřejnost
- Apple I – Steve Wozniak, skvělá architektura
  - Steve Jobs mu pomohl marketingově
  - někdo vytvořil aplikaci VisiCalc (počítání daní) – killer app
- Atari – hraní her, připojovalo se k televizi, tyto počítače se dostaly do tehdejšího Československa přes železnou oponu
  - procesor 6502 (díky ukradení plánů na výrobu procesoru vznikaly československé kopie počítačů)
- všechny procesory do té doby měly von Neumannovu architekturu, byly 8bitové a používaly 16bitový adresový prostor
  - 8bitový procesor umožňuje pracovat s 8bitovými čísly
- IBM PC – procesor 8088
  - procesor typu x86-16
  - 16bitový procesor (uměl zpracovat dvě 16bitová čísla najednou)
  - 20bitový adresový prostor – zvládl adresovat 1 MB
  - 64 kB RAM
  - při zvýšení paměti (koupi nového počítače) se daly používat původní programy – díky tomuto triku se počítače ujaly
- Intel – architektura x86 / IA-32
  - 32-bit procesor, 32-bit adresový prostor → až 4 GB
  - 2 instrukční sady – jedna 16-bit, druhá 32-bit, dá se mezi nimi přepínat
- AMD – architektura Intel 64 / x64
  - 64-bit, 64-bit
  - 3 instrukční sady
základní instrukce – srovnání 6502 a x86
instrukce skoku – nastavím IP na konkrétní hodnotu (nepodmíněný skok – unconditional jump)
- podmíněný skok (conditional jump) – potřebujeme u if
- řídící struktury (podmínky a cykly) se dají implementovat pomocí těchto dvou skoků
je těžké pamatovat si instrukce procesoru a psát přímo strojový kód → pro každý procesor se vymyslí tzv. assembler (assembly code)
- je důležité chápat rozdíl mezi textovým zápisem assembleru a samotným strojovým kódem
při překladu je potřeba složité příkazy rozdělit do jednoduchých
procesory typicky vyžadují, aby maximálně jeden argument instrukce byl adresa, ostatní argumenty tedy musíme uložit do registru
registry procesoru
- speciální registr (PC/IP)
- obecné registry – tam uložíme proměnné, abychom je mohli použít jako argumenty instrukce
a = b + c
- LOAD addr(b) → R1
- ADD R1 + addr(c) → R2
- STORE R2 → addr(a)
procesory s load/store architekturou jsou omezené tak, že všechny argumenty musí být v registrech (např. architektura MIPS)
dva typy LOAD
- nahrání konstanty (immediate) – přímá hodnota jako součást instrukce
- nahrání pomocí adresy
např. pro registr A jsou to instrukce LDA, STA
instrukce kopírování mezi registry (transfer)
- např. kopírování X → A by se zapsalo jako TXA
kopírování hodnot mezi bajty v paměti – postupně LDA, STA (pro každý bajt dané hodnoty)

8. přednáška

registry
- A, X, Y – pomocné registry pro účely programu (u 8-bit procesoru budou 8-bit)
- PC – u 16-bit adresového prostoru bude 16-bit
- P – příznakový registr (flags register)
  - příznak (flag) = 1 bit informace
  - typické příznaky
    - zero – byl výsledek poslední operace roven nule?
      (1 = ano, byla nula; 0 = ne, nebyla nula)
    - sign/negative – označuje znaménko výsledku poslední operace
      (1 = –, 0 = +), čísla se typicky zaznamenávají ve dvojkovém doplňku
    - carry – pokud potřebujeme u nějaké operace uložit jeden bit navíc
      - instrukce CLC (nastavuje na 0), SEC/STC (nastavuje na 1)
  - instrukce můžou mít side-effect – mění určité příznaky
  - ke čtení příznaků se typicky používají podmíněné skoky
dva typy registrové architektury
- obecná registrová architektura … x86
- akumulátorová architektura … 6502
  - akumulátor A, většina instrukcí umí pracovat jenom s tím akumulátorem
místo instrukce NOT se dá použít XOR #$FF (respektive EOR #$FF)
8bitové sčítání
- 8-bit vstup A
- 8-bit vstup B
- 1-bit vstup Cin (carry in)
- 8-bit výstup R
- 1-bit výstup Cout (carry out)
instrukce ADC (add with carry)
- ke carry vstupu a výstupu používá carry příznak
- před začátkem výpočtu je potřeba vynulovat carry příznak
odčítání
- v 7-bit přesnosti pomocí negace a přičtení jedničky (viz dvojkový doplněk)
- 8-bit rozdíl/subtract – subtract with borrow (SBB) – na x86
- subtract with carry (SBC) – na 6502
  - chceme A – X – B
  - trik: A – X – B + 256
  - borrow je negace carry
  - A – X – (1 – C) + 256
  - A – X – 1 + C + 256
  - A – X + C + 255
  - A + (255 – X) + C
  - A + NOT(X) + C
  - $\alpha$ = NOT X
  - A + $\alpha$ + C
  - ADC $\alpha$
- registry x86
  - 32-bit: EAX, EBX, ECX, EDX, ESI, EDI, EBP
  - 8bitové/16bitové „virtuální“ registry – např. AX, AH, AL
- instrukce x86
  - MOV na přesouvání
  - ADD (nepřičítá hodnotu carry, jako CLC + ADC)
  - SUB
- výpočet $r=a+b+e-(c+d)$ $r = a + b + e - (c + d)$
  - na 6502 můžu používat pouze akumulátor, k tomu musím ukládat mezi výpočty do paměti
  - na x86 si vystačím s registry

9. přednáška

taktovací frekvence (clock rate) – dnes v řádu GHz
- 1 takt/cycle
- nejrychlejší instrukce (fast) – procesor je stihne za jeden takt, všechny tyto operace pracují s hodnotami v registrech
  - bitové operace (AND, SHL, …)
  - ADC/SBB
- pomalé operace (slow) – práce s pamětí
  - LOAD/STORE
  - operace s implicit load (např. ADC počítající s číslem z paměti)
- pozn.: pokud sčítám 64-bit čísla na 8-bit procesoru, musím provést 8 operací sčítání + nějaké operace load a store
- 6502 má cca 1 MHz
- x86 cca 33 MHz
- procesor má cache, která urychluje přístup k paměti
sign extension – při rozšíření čísla na víc bytů zachováváme jeho znaménko – u záporných čísel přidáváme jedničky, u kladných nuly
v Pythonu každé číslo zabírá 4 byty, protože počítače bývají 32-bit (a více)
v Pythonu ukládám pointer (ukazatel/reference) na objekt s hodnotou, typem, garbage collector ref countem, délkou…
garbage collector – udržuje si informaci o počtu odkazů na daný objekt, pokud je nula, tak objekt smaže
v jazycích C/C# může nastat aritmetické přetečení (arithmetic overflow)
- uint8: 255 + 1 = 0
- int8: 127 + 1 = –128
- podtečení … při odčítání
procesory x86 a x64 mají operace násobení a dělení
- násobení: 1–10 taktů
- dělení: cca 50–100 taktů
- u 6502 je potřeba SW implementace
shift left funguje jako násobení mocninou dvojky
- $x\text{ SHL } n = (x \cdot 2^n) \mod 2^z$
shift right funguje jako celočíselné dělení mocninou dvojky
arithmetic shift right – u záporných čísel doplňuje jedničky místo nul
programovací jazyky implementují různě, v Pythonu SHL + SAR, v C# SHL + SHR (uint) / SAR (int), v Javě SHL (<<) + SAR (>>) + SHR (>>>)
reprezentace reálných čísel
- 20,625
- fixed-point 8bit
  - 20 + 0,625
  - 10100,101
  - 5.3 nebo 5+3
- není problém s aritmetickými operacemi
- problém u velkých a malých čísel
- reálné číslo reprezentované jako fixed-point na float převedu vydělením n-tou mocninou dvojky

10. přednáška

floating-point
- normalizovaná
  - 1 číslice před desetinnou čárkou
  - žádné leading zeros
  - bez nuly
- uložíme mantisu (significand) a exponent
- exponent uložíme na stranu MSb, mantisu na stranu LSb
- floating-point se skrytou jedna – využijeme toho, že každé číslo začíná jedničkou (zakázali jsme leading zeros), takže ukládáme až číslice za desetinnou čárkou
- celá signed čísla: reprezentace s posunem (bias)
  - např. 8-bit → rozsah 0 až 255
  - 255 = nejvyšší kladná hodnota (128)
  - 127 = 0
  - 0 = nejnižší záporná hodnota (–127)
  - ale pokud bychom chtěli víc kladných a míň záporných hodnot, tak se to dá posunout
- pomocí posunu se vyjadřuje znaménko exponentu
- znaménko mantisy se vyjadřuje pomocí znaménkového bitu (MSb)
- taková čísla se nedají sčítat (ale dají se porovnávat) → je potřeba SW nebo HW implementace
- některé procesory mají speciální registry a operace s floating-point čísly
- x86/x64 a dražší ARMy mají podporu, levnější ARMy, 6502 nemají
- standard pro floatová čísla IEEE 754
  - single 32-bit – v numpy float32, v C# float
  - double 64-bit – v Pythonu float, v numpy float64, v C# double
- během aritmetiky musí dojít k denormalizaci
- 0.1 se nedá zapsat s ukončeným desetinným rozvojem
- nula = samé nuly (až na znaménko) – standard definuje, že se kladná nula rovná záporné nule
- samé jedničky v exponentu a nulová mantisa → kladné/záporné nekonečno
  - funguje dělení nulou
- samé jedničky v exponentu a nenulová mantisa → not a number (NaN)
  - $\infty/\infty =$ NaN
  - jsou dva typy NaN

11. přednáška

jednočip/microcontroller/ $\micro$ $\micro$ C/MCU
- SRAM data memory – 256 B, volatile
- CPU + registry
- code memory – non-volatile
  - ROM (Read Only Memory)
  - PROM (Programmable ROM) – jeden zápis, nekonečno čtení; funguje na základě spálení diod
  - EPROM (Erasable PROM) – nekonečno zápisů, nekonečno čtení
    - maže se UV zářením, je potřeba nechat to na slunci 20 minut
  - EEPROM (Electrically EPROM) – „nekonečno“ zápisů, nekonečno čtení
  - flash – „nekonečno“ zápisů, nekonečno čtení
  - EEPROM + flash se dnes používají nejčastěji – souhrnný název NVRAM
  - EEPROM × flash
    - EEPROM – posloupnost bajtů
    - flash – bajty ukládá v blocích po 1–16 kB
    - EEPROM má sekvenční, random 1 byte a random block čtení průměrně rychlé
    - flash má pomalejší random 1 byte, ale rychlejší sekvenční čtení i random block čtení
    - zcela nekonečné zápisy nejsou možné, protože elektronům se postupně „přestává chtít ven z komůrek, kde jsou zabedněné“
      - takže při běhu programu se používá RAM, do non-volatile paměti se v případě potřeby zapisuje v určitém rozumném intervalu
- ADC (převodník z analogového na digitálního signálu)
  - např. uživatelský vstup – potenciometr
- DAC – analogový výstup
- GPIO řadič (General Purpose Input/Output)
  - registry ovlivňující, zda jsou piny vstupní/výstupní
- permanentní datové úložiště (mass storage device)
von Neumannovská architektura
- DRAM – kód + proměnné
- CPU + SRAM
pevný disk / hard disk drive (HDD)
- magnetický zápis
- dipól – otočený na jednu stranu (podle toho 1 nebo 0)
- dipóly jsou uloženy ve soustředných kružnicích
  - jedna kružnice = stopa
  - stopy jsou rozdělené na sektory (sektory jsou v podstatě kruhové výseče)
  - na jednom sektoru původně 512 B, dnes 4 kB (4096 B, advanced format)
- čtecí hlava
- 7200 RPM (otáček za minutu)
- náhodný přístup v jedné stopě je lepší než sekvenční přístup pozpátku
- hlava se otáčí, aby přistupovala k různým stopám – tomu se říká seek (seek time – doba otočení)
- náhodný přístup mezi stopami je extrémně pomalý
- přístup v řádech ms (jiné paměti se pohybují v řádu ns)
- vhodné pro archivaci
- několik ploten, lze zapisovat z obou stran každé z nich
- všechny hlavy se pohybují najednou
- stopám, které jsou nad sebou, se říká cylinder
- v praxi se čísluje trojicí čísel – cylinder/hlava/sektor
- stopy vzdálenější od středu mohou být rozděleny na více sektorů pro dosažení větší kapacity
- úhlová rychlost je stejná, ale rychlost čtení/zápisu u jednotlivých stop se liší
CD/DVD/BluRay
- zápis/čtení pomocí laseru
- pomalejší zápis/čtení
- jedna spirální stopa
- Linear Block Addressing
- jakmile dojdou data, přestává čtení – takže lze mít různé tvary CD
- 1 sektor = 2048 B
řadič DVD
- address register (LBA)
- buffer = 1 sektor
- command register – podle toho, zda chci provádět čtení/zápis
- status register – ready?
- info register – kapacita disku
- potřebuju „magii“, která zajistí přesun dat z řadiče do paměti zařízení
  - data register – obsahuje interní address reg., vrací vždy 1 bajt z bufferu
řadič HDD (HDC = Hard Drive Controller)
- řadič pevných disků se ovládá podobně jako řadič DVD, dostává LBA adresu
flash paměť s řadičem pevného disku – SSD
USB fleška: USB řadič → USB kabel → řadič → flash paměť
jakmile se data nahrají z disku do paměti, jsou uloženy v nějaké posloupnosti adres – první z nich se nazývá bázová
v Python potřebujeme pole bytů, není rozumné používat seznam, protože každé číslo seznamu by mělo svůj overhead
chceme na disk ukládat soubory
- pamatujeme si data samotného souboru + metadata
  - metadata
    - seznam sektorů, kde je soubor uložený (nemusí být přímo za sebou → fragmentace)
    - délka v B
    - cesta souboru – adresáře (directories, složky/folders) a název souboru
    - datum, čas apod.
- metadata → souborový systém (file system)
  - kromě zmíněného obsahuje i seznam volných sektorů
- přístup k souborům řeší operační systém
  - soubor se otevře (jeho metadata se načtou do cache) → pracuje se s ním → zavře se (aby OS věděl, že ho nemusí držet v paměti)

11,5. přednáška

pythoní funkce open zavolá funkci operačního systému (OpenFile), která do paměti uloží metadata a vrátí ID souboru, které se uloží v pythoním objektu
soubor se dá otevřít jako binární (s příznakem b) – výsledný objekt má jiný typ
na binárním souboru máme funkci read, které zadáme, kolik bytů chceme přečíst
- operační systém si do paměti připraví celý sektor, z něj vrátí požadované bajty
- pythoní objekt si pamatuje aktuální offset
- read posouvá offset o počet čtených bajtů, pokud chceme skočit k aktuálnímu bajtu, můžeme použít funkci seek (tato funkce umožňuje skákat relativně), funkce tell slouží ke zjištění aktuálního offsetu
- pythoní funkce seek nesouvisí se čtecí hlavou
funkce readline (u textového souboru) vrátí celý řádek ve formě textu
textový soubor (text file) – všechny bajty souboru se dají interpretovat jako text
binární soubor (binary file) – pro některé nebo všechny bajty platí, že se nedají interpretovat jako text
hexdump / hexview
file format – specifikace, co bajty na konkrétních offsetech v souboru znamenají
binární soubory často na začátku obsahují metadata (hlavička souboru / header, může být na konci souboru nebo např. před skupinou dat)
na začátku souboru může být sekvence bytů, která jednoznačně určuje formát (takže lze případně vyloučit, že se jedná o soubor v daném formátu) – magic number / signature
MIDI soubor – zápis not (není uložen zvuk)
- začátky a konce not
soubor BMP
obraz disku

12. + 12,5. přednáška

reprezentace obrazových dat
fotka = obdélníkový obrázek
doba expozice (n-tina sekundy) – za tu dobu se počítá, kam dopadají fotony
na sítnici oka dopadají fotony – vnímáme nějaký průměr
fotku můžeme rozdělit na čtverečky – pixely
potřebujeme označit pixely
sloupečky (osa x) se číslují od nuly zleva doprava
řádky (osa y) se číslují od nuly shora dolů
pixely se obvykle ukládají po řádcích, v rámci řádku zleva doprava
pixel nemusí mít jeden bajt
intenzita světla (počet fotonů) může nabývat hodnot 0 až nekonečno
pixel bude n bitů – bpp (bits per pixel) = bitová hloubka (bit depth)
nejjednodušší
- jeden bit na pixel
- stanovíme hraniční intenzitu – hodnoty pod ní uložíme jako nula, nad ní jako jedna
- velmi omezená informace
- pro určité zobrazovací technologie (klasický LCD displej) dostačující
- tento princip ukládání nám umožňuje pixely sdružit např. po čtveřicích (tedy snížit rozlišení) a zachycovat odstíny šedé kombinací různého počtu černých a šedých pixelů (tzv. differing)
- https://en.wikipedia.org/wiki/List_of_monochrome_and_RGB_color_formats
jeden bajt na pixel
- stanovíme dvě meze – spodní (0) a horní (255)
- intenzitu uložíme jako číslo v rozmezí 0 až 255
- meze je potřeba stanovit podle situace
bylo by hezké zaznamenávat obrázky, kde jsou oba extrémy (a u těchto extrémů ukazovat detaily)
- použijeme floating-point čísla
- HDR (High Definition Range)
- moc se nepoužívá – je těžké takovou fotku zachytit atd.
chceme barvu
dívali jsme se jenom na počet fotonů, ne na jejich frekvenci (tedy barvu)
frekvence může být 0,00… (nenulová) až nekonečno
- obvykle nás zajímá viditelné světlo
v oku
- tyčinky – monochromatické vidění, velký rozsah
- čípky – barevné vidění, malý rozsah
  - tři druhy čípků – jsou citlivé na různé frekvence (červené, zelené, modré)
barevný kanál → 3 kanály (RGB), nezávislé informace
3-bit RGB – za každou barvu uložíme 1 bit
špatně se dělí osmi, přidáme bit navíc
4-bit RGBI – navíc tmavší varianta barvy
16-bit RGB
- každou barvu pomocí 3 bitů
- co s posledními bitem?
  - dáme ho zelené složce, protože tu lidské oko zvládne nejvíc rozlišovat
  - nebo s ním také nemusíme dělat nic (→ 15-bit RGB)
24-bit RGB
- 8 bitů na kanál
- hi-color / True Color
- ale máme 32bitové instrukce procesoru
32-bit ARGB
- čtvrtý bajt je tzv. alpha kanál
  - 255 = neprůhledný pixel
  - 0 = zcela průhledný pixel
metadata obrázku
- počet kanálů
- bitů na pixel/kanál (bitová hloubka)
- šířka v pixelech
- výška v pixelech
- další informace ve formátu EXIF
jak uložit pixel
- typicky ARGB (A v MSB, B v LSB)
- nebo také RGBA
- navíc záleží na endianitě
- takže existují 4 možnosti: ARGB, RGBA, BGRA, ABGR
- buď je v metadatech informace o pořadí složek, nebo je to ve specifikaci formátu
rastrový obraz, bitmapa
formát BMP
- specifický způsob ukládání – zespodu nahoru
- každý řádek je zarovnaný (align) – na konci má padding (nadbytečné bajty bez významu), aby řádky začínaly na místech dělitelných čtyřmi (aby se dobře načítaly)
textová data
textový řetězec (string) = posloupnost znaků
znak
- písmeno
- číslice
- speciální znak
- bílý znak (whitespace)
- řídicí znak
kódování
- jeden znak → jeden kód
- kód → bitová reprezentace
  - pevná délka / proměnná délka
rasterizace textu
- převod kód → obrázek (znak)
poznámka: jazyky se ukládají v pořadí, v jakém se čtou
kódování
- ASCII
  - 7bitové (0–127)
  - písmena abecedy jsou uloženy za sebou, podobně číslice
  - znak nuly nemá kód nula
  - mezera má kód 32 (šestnáctkově 20)
  - při ukládání je MSb typicky nevyužitý
- 128–255 jsou volné
  - rozšíření ASCII, tzv. codepage
  - nestačí ani na všechny evropské znaky – Evropa se rozdělila na tři části
  - ISO 8859-2 (ISO Latin2)
  - 852 (DOS Latin2)
  - Windows-1250
  - nedá se napsat text, který by měl více kódování najednou (problém např. pro slovníky)
- Unicode
  - 0–127 odpovídají ASCII
  - běžné znaky jsou v rozsahu 0–$FFFF
    - je tam rozsah, kde je garantováno, že daným kódům nikdy nebudou přiděleny žádné znaky
  - „neběžné“ znaky v rozsahu $10000–$10FFFF
  - UTF-32
    - jeden znak 4 bajty
    - UTF-32LE / UTF-32BE
    - prakticky se nepoužívá
  - UCS-2
    - každý znak je dvoubajtový
    - podporuje málo znaků
  - UTF-16
    - má proměnnou délku znaku – 2B nebo 4B
    - 4B znak se zachycuje pomocí sekvence dvou dvoubajtových surrogate znaků (z nepoužívaného „déčkového“ rozsahu)
    - UTF-16LE / UTF-16BE
  - UTF-8
    - proměnná délka znaku – 1, 2, 3, 4B
    - princip kódování vícebytových znaků
    - vícebytové znaky mají v prvním bytu MSb roven jedné
      - pak počet bytů odpovídá počtu jedniček na začátku prvního bytu
      - první byte sekvence začíná 11, další byty začínají 10
    - neřeší se endianita
nejběžnější kódování
- internet: UTF-8
- Windows: UTF-16LE
když chceme text zobrazit uživateli – provedeme rasterizaci
zalomení řádku
- CR (carriage return) – kód 13
- LF (line feed) – kód 10
- Windows: CR + LF
- Unix/Linux: LF
- Apple dříve: CR
Unicode (v podstatě nepoužívané)
- LS – line separator
- PS – paragraph separator
textový soubor jako posloupnost bytů
- v Pythonu otevřeme pomocí r nebo w
- řádky načítáme pomocí readline
- v Pythonu je text uložen pomocí Unicodu
- u příkazu open můžeme definovat kódování
- výchozí kódování je win-1250 (obecně podle operačního systému)
chceme uložit binární soubor s textem (ale také dalšími daty)
- data
  - 2B číslo
  - 4B délka textu
  - text
  - 4B číslo
- pro převod na správný počet bytů můžeme použít funkci tobytes knihovny numpy
- bajty stringu můžeme získat pomocí funkce str.encode
- převod ze seznamu čísel na byty lze provést pomocí bytes()
- převod bytů na konkrétní data se provádní pomocí frombuffer(bytes, type)
- typ bytes je immutable
- typ byteArray je mutable
- bytes.decode – převede bajty na string

13. přednáška

von Neumannovská architektura
mezi procesor a paměť vložíme řadič paměti (memory controller)
řadič paměti zajišťuje refresh DRAM paměti, takže pokud procesor ukládá během refreshe, tak se data pozdrží a uloží se do paměti po refreshi
když chceme 1,5GB paměť, tak pořídíme dvě paměti (1GB a 0,5GB)
řadič paměti je namapuje v adresovém prostoru, aby fungovala kapacita 1,5 GB (modul 0 mapuje na první paměť, modul 1 na druhou)
procesor a paměť můžou mít různé komunikační protokoly – řadič to propojuje (to souvisí s velikostí adresových prostorů – např. procesor podporuje 8GB, ale paměti jenom 4GB, řadič umožňuje mít dvě 4GB paměti)
chceme, aby z procesoru vedla pouze jedna sběrnice – budeme jí říkat systémová sběrnice, je na ni napojen řadič paměti i všechno ostatní
každé zařízení na sběrnici má svou adresu
každé zařízení má nějaké registry
když oslovujeme zařízení, tak řekneme adresu zařízení a adresu registru, se kterým pracujeme – pak až pošleme data
potřebujeme, aby ta sběrnice byla multidrop (abychom mohli připojit více zařízení)
potřebujeme, aby ta sběrnice měla nějakou vlastnost, kterou I2C nemá – proto se jako systémová sběrnice typicky používá sběrnice PCI Express (PCIe)
PCIe
- full duplex, multidrop
- dva druhy packetů (transakcí)
  - adresace adresou zařízení
  - adresace adresou v paměťovém adresovém prostoru
    - memory write (MWr)
    - memory read (MRd)
      - procesor pošle požadavek
      - řadič paměti si ho zapamatuje a začne na tom pracovat
      - řadič v nějakém okamžiku pošle zpátky odpověď – řadič paměti vystupuje jako master, procesor jako slave, takže potřebujeme být schopni adresovat procesor
        
        zejména pokud máme více procesorů (nebo procesorových jader)
        
        v odpovědním packetu je kromě adresy procesoru také adresa řadiče paměti, aby si mohl procesor odpověď správně spojit s požadavkem
jak oslovovat zařízení na systémové sběrnici?
- v paměťovém prostoru je obvykle spousta volného místa
- toto volné místo namapujeme na zařízení
- memory mapped I/O (MM I/O)
- zařízení řekneme bázovou adresu v adresovém prostoru
- z dokumentace zařízení zjistíme offset registru
- když to zkombinujeme s bázovou adresou, tak zjistíme, na kterou adresu zapisovat
- říká se tomu Host Controller Interface (HCI) – víme, co který registr dělá a na jakém je offsetu
- komunikační protokol je daný systémovou sběrnicí
zvuková karta
- zvuk = tlak se mění v čase
- tlak budeme vzorkovat v čase – vždycky zaznamenáme jeho hodnotu
- sample … signed integer
  - nekvalitní … 8-bit
  - klasická kvalita … 16-bit
  - kvalitnější … 24-bit
- v reproduktoru je membrána s elektromagnetem – podle napětí elektromagnet membránu přitahuje silně/slabě
- zvuková karta je jednoduchý digital analog converter (DAC) – podle vzorků vytváří napětí
- potřebujeme ve stejných intervalech, jako se zaznamenával vstup, udávat napětí
  - sampling rate
  - typicky 44,1 kHz
  - někdy 22 kHz nebo 96 kHz
- potřebujeme cyklus, který bude dělat store do registru zvukové karty v daném (velmi přesném) intervalu
- bylo by hezké, kdybychom si mohli ve zvukové kartě připravit 1 ms předem (v bufferu) a zvuková karta by to následně přehrála (hodila by v tom bufferu po těch vzorcích a přehrávala by je)
- zvuková karta tedy musí mít sadu konfiguračních registrů, kam uložíme různé informace (velikost vzorku, vzorkovací frekvence)
  - chceme mít n mikrofonů → n reproduktorů (mono/stereo/…)
  - chceme spustit/ukončit přehrávání
  - chceme nahrávat (tedy analog-digital converter)
  - chceme znát aktuální stav zvukové karty (co zrovna přehrává)
- u zařízení s vícebytovými registry musíme řešit jejich endianitu (a případně převádět)
- chceme mixovat zvuk – průměrujeme dva vzorky (pokud mají různou hlasitost, tak děláme vážený průměr)
- dnešní zvukové karty mají HW akceleraci (CPU offloading) – typickým úkolem je právě mixování zvuku
- DSP (digital signalling procesor) – strojovým kódem tohoto procesoru můžeme ovládat, jak se má zvuková karta chovat
řadič sběrnice
- procesor – PCIe – USB řadič – USB sběrnice
- takovým řadičům se říká HBA (Host Bus Adapter) – někdy také nesprávně bridge
- USB HBA je komplikovaný, takže se podíváme na I2C HBA
- průběh
  - pošleme write do konfiguračního registru, aby se do start condition bitu nastavila jednička
  - pomocí readu čekáme, až tam bude jednička
  - ze stavového registru přečteme stav řadiče
  - chceme poslat první (adresový) bajt
  - zrušíme start condition bit
  - …
  - pošleme data
  - …
- mnoho transakcí na systémové sběrnici na jednu transakci na I2C lince
- čekání = device polling, ztrácíme procesorový čas
grafická karta
- je k ní připojený monitor
- obsahuje paměť (typicky DRAM) – „video RAM“
  - v její části je frame buffer – tam je bitmapa stavu obrazovky
  - karta x-krát za sekundu posílá monitoru obsah frame bufferu
    - tradičně se používala analogová linka VGA
    - dnes se používají digitální sériové linky DVI, HDMI, DisplayPort
  - nechceme frame buffer obsluhovat pomocí registrů, bylo by to neefektivní
  - frame buffer namapujeme do adresového prostoru, abychom do něj mohli zapisovat přímo
  - mezi snímky je díra (aby se CRT paprsek mohl přesunout na začátek)
  - registr grafické karty mi dává informaci o stavu vsync (že teď se právě paprsek přesouvá – je okamžik mezi snímky)
  - v okamžiku mezi snímky můžeme změnit obraz (překopírovat data do frame bufferu nebo říct jinou bázovou adresu frame bufferu, pokud máme dva frame bufferu, které střídáme – tzv. princip double bufferingu)
- hardwarová akcelerace
  - rasterizace textu
    - kartě se nastaví textový režim
    - má pole bitmap, které odpovídají znakům
    - znaky přímo převádí na jim odpovídající bitmapy
    - dnes se příliš nepoužívá
  - rasterizace 2D
  - rasterizace 3D
    - do paměti nahrajeme mesh 3D modelu (trojúhelníky) a odpovídající textury, kterými se mesh pokryje – engine podle toho generuje obsah frame bufferu
- moderní grafická karta má procesor
- programu pro takový procesor se říká shader
jak dostat kód na von neumannovskou architekturu
- jeden z paměťových modulů může být non-volatile – ROM
- vykonává základní program, budeme mu říkat firmware
- procesor má nastavený startup vector, což je adresa, kam se procesor nastaví po zapnutí
- na té adrese je typicky jump, který směřuje jinam na reálný kód firmwarové ROM
- funkce firmwarové ROM
  - bootování počítače
    - test a konfigurace hardwaru
      - plug & play – každému zařízení se přiřadí jiná bázová adresa a funguje to
    - nalezení užitečného softwaru
      - provede se jump na option ROM, kde je užitečný software (třeba editor a interpret basicu)
      - myšlenka, že bychom chtěli distribuovat programy
        
        koupím si cartridge
        
        zapojím ji do počítače
        
        namapuje se jako další option ROM
        
        je tam nějaký magic
      - užitečný software taky může být na mass storage device
        
        pevný disk je rozdělený na sektory, je to zformátované souborovým systémem
        
        nultý sektor je speciální – boot sector
        
        může tam být strojový kód něčeho užitečného, co by se mělo spustit
        
        je tam magic, který určuje, jestli je to zařízení bootovatelné (jestli v boot sektoru je něco rozumného)
      - jednotlivá zařízení (třeba grafická karta) mají své option ROM
      - v boot sektoru je typicky pouze část užitečného softwaru – bootloader
    - další funkce – firmwarové ROM: abstrakce nad hardwarem
      - funkce read sector, read key, print char
      - aby bootloader mohl používat tyto základní funkce
kdysi na jedné disketě jeden program
dnes si chceme vybírat z různých programů
jádro operačního systému (kernel)
- poskytuje abstrakci souborového systému
- abstrakce HW (lepší než firmware) – vstup/výstup (klávesnice, myš, text, grafika)
- spouštění programů
  - typicky to nejprve spustí tzv. shell, aby si uživatel mohl vybrat, jaký program chce spustit
  - shell může být textový nebo grafický
  - více programů současně – programy se střídají (je to zjednodušení, více na počítačových systémech)