Algoritmy pro rozsáhlá data doc. RNDr. Tomáš Masopust, Ph.D., DSc.

Základní informace

Poznámky a materiály k přednáškám

  1. Úvod, hashování - viz text po str. 19.
  2. Hashování - text po str. 24 a text Martina Mareše
  3. Lineární sondování a Robin Hood hashing. Konzistentní hashování -- hashring a chord - text od str. 27 plus animace ve slajdech a předchozí text M. Mareše.
  4. Bloomovy filtry - text od str. 40
  5. Heavy Hitters a Count-Min Sketch - text od str. 65 a text ze Stanfordu
  6. Kardinalita a (Hyper)LogLog - text od str. 84 a článek
  7. Model externí paměti - text od str. 123
  8. B-stromy a jejich varianty - text od str. 138 - a texty D. Mount, lecture notes a D. Comer, Ubiquitous B-Tree, případně J. Wyss-Gallifent. A ještě něco k B*-stromům.
  9. Bε-stromy a LSM-stromy - text od str. 151 a články An Introduction to Bε-trees and Write-Optimization a LSM-based Storage Techniques: A Survey

Domácí úkol 1

Nick deduplikace (čas) pocet kroku vyhledávání: lineární / binární (čas) poznámka
BIZZY x x funguje, ale nenacita vstup, takze nelze porovnat.
DivideAndConqueror 18m27.270s 99161872 / 30 (0m38.102s) 2. ukol, binarni pocty kroku
Holoubek 28m27.365s 99161872 / 6024 (0m57.528s) 2. ukol, binarni pocty kroku jsou spatne
Iceburgh 22m30.680s 99161872 / 30 (6m22.189s)
Kris TypeError 99161872 / 28 (0m37.528s) ukol 1: chyba v programu;
Losik ValueError 99161872 / 28 (0m43.484s)
min 22m45.199s SyntaxError
Nickelodeon 31m27.586s 99161872 / 30 (6m5.538s)
panda1432 38m59.784s -
Počagar 18m57.676s 99161872 / 30 (6m24.754s) 2. ukol, binarni pocty kroku
PošťákPet 22m6.075s -
soul123 IndexError 99161871 / 30 (6m17.671s)
Špunt 29m55.840s -

Domácí úkol 2

Domácí úkol 3 - zápočtový

Domácí úkol 4 - zápočtový

Domácí úkol 5

Domácí úkol 6

Správce stránky: Tomáš Masopust