SQLite, MySQL a PostgreSQL: tvoje open-source řešení pro relační databáze
Zjisti, který správce relačních databází bude tím pravým řešením pro tvůj projekt.
Dnes narazíš na celou řadu nástrojů na správu databází. V odvětví data science ale převládají relační datové modely, které organizují data v tabulce do řádků a sloupců. Proto si představíme nejznámější open-source řešení, mezi něž patří SQLite, MySQL a PostgrestSQL.
Co je to SQLite
SQLite je vestavěný relační systém pro správu databází bez připojení k serveru. Jde o in-memory open-source knihovnu s nulovou konfigurací, která nevyžaduje instalaci. Databáze se používá pohodlně, protože má velikost zhruba 600 kB, což je podstatně méně než u ostatních relačních databází.
SQLite umožňuje každému procesu číst a zapisovat data přímo do diskového souboru. Zjednodušuje se tak proces nastavení, neboť odpadá nutnost konfigurace serveru a jeho dalších procesů. Pro správu databáze také není třeba nastavovat program pro její správu (např. HeidiSQL), protože si vystačí pouze s přístupem k disku.
Jaké má výhody
Velikost: Knihovna SQLite zabírá poměrně málo místa (v závislosti na systému), a to zhruba 600 kB. Databáze je tak plně samostatná a pro její fungování není potřeba do systému instalovat další moduly.
Uživatelsky přívětivá: SQLite je databáze s „nulovou konfigurací“. Není navržená tak, aby byla závislá na serveru, takže nepotřebuje zastavovat, spouštět, restartovat ani konfigurovat. Díky tomu se zjednodušuje instalace i integrace s aplikací.
Přenosná: Databáze SQLite je uložena v jednom souboru. Ten může být umístěn kdekoliv v adresáři. Databáze se dá sdílet prostřednictvím vyměnitelného média nebo protokolu pro přenos souborů.
Jaké má nevýhody
Omezená souběžnost: Přestože k databázi SQLite můžeš přistupovat a dotazovat se na více procesů současně, tak lze provádět pouze jedna změna v danou chvíli.
Žádná správa uživatelů: SQLite čte a zapisuje přímo do diskového souboru, a tak jediná použitelná přístupová práva jsou v souladu s operačním systémem. Proto SQLite není vhodná pro aplikace, kde je potřeba více uživatelů s odlišnými právy.
Bezpečnost: Databázový správce, který používá server, může v některých případech poskytovat lepší ochranu před chybami v klientské aplikaci než databáze bez serveru, jako je SQLite.
Kdy se vyplatí využít SQLite?
Vestavěné aplikace: SQLite je skvělou volbou databáze pro aplikace, které potřebují být přenositelné a nepočítají s budoucím rozšířením. Příkladem jsou lokální aplikace pro jednoho uživatele, mobilní aplikace nebo hry.
Testování: Pro mnoho aplikací může být zbytečné testovat jejich funkčnost pomocí relačních databází, které jsou založené na serverových procesech. SQLite má režim in-memory, který se dá využít k rychlému spuštění testů bez nadbytečných operací.
Kde se nevyplatí používat SQLite?
Práce s velkým množstvím dat: SQLite technicky zvládne databázi o velikosti až 140 TB. Ve chvíli, kdy je větší než 1 TB, pak je lepším řešením centralizovaná databáze klient-server, protože správa databáze v SQLite je o poznání složitější.
Vysoké objemy zápisu: SQLite umožňuje v daném okamžiku provést pouze jednu operaci zápisu, což výrazně omezuje její propustnost. Pokud aplikace vyžaduje velké množství souběžných zápisů, tak není vhodným řešením.
Je vyžadován síťový přístup: Protože SQLite je databáze bez serveru, neposkytuje přímý síťový přístup k datům. Případné řešení přes server často bývá nákladné a neefektivní, a proto je lepší databázový systém typu klient-server.
Co je to MySQL
MySQL je systém pro tvorbu relačních databází, který vyvíjí společnost Oracle. Používá se ke správě strukturovaných dat – od jednoduchých až po složité množství informací v podnikových sítích.
Databáze MySQL je nedílnou součástí oblíbených softwarových balíčků pro vytváření a údržbu webových aplikací pro zákazníky a B2B služby založených na datech. Díky jejímu open-source charakteru, stabilitě, bohaté paletě funkcí a neustálému vývoji a podpoře ze strany Oracle ji řada společností využívá jako backendové řešení pro své webové stránky.
Výhody MySQL
Oblíbenost a snadné používání: Protože se jedná o jeden z nejoblíbenějších databázových systémů na světě, není nouze o zkušené správce MySQL databází. Dostupné tak jsou informace pro správu, konfiguraci a další užitečné rady pro začátečníky.
Bezpečnost: MySQL se dodává se skriptem, který pomáhá zlepšit zabezpečení databáze – od nastavení úrovně zabezpečení instalace, definování hesla pro uživatele účtu root, odstranění anonymních účtů až po testovací databáze.
Rychlost: Tím, že se vývojáři MySQL rozhodli neimplementovat některé funkce SQL, mohli upřednostnit rychlost před plnou kompatibilitou s jazykem SQL.
Replikace: MySQL podporuje řadu různých typů replikace, což je sdílení informací mezi dvěma nebo více hostiteli, kteří zlepšují spolehlivost, dostupnost a odolnost databáze proti výpadkům při vytváření zálohy nebo při horizontálním škálování.
Nevýhody MySQL
Známá omezení: Vzhledem k tomu, že MySQL byla navržena spíše pro rychlost a snadné používání než pro plnou shodu s SQL, má určitá funkční omezení.
Licence a proprietární funkce: MySQL je software s dvojí licencí, s bezplatnou komunitní edicí s otevřeným zdrojovým kódem GPLv2 a několika placenými komerčními edicemi. Z tohoto důvodu jsou některé funkce a zásuvné moduly dostupné pouze pro placené verze.
Zpomalený vývoj: Od doby, kdy projekt MySQL od roku 2009 vlastní společnost Oracle Corporation, si uživatelé všimli pomalejšího vývoje, který by dostatečně reagoval na požadavky komunity.
Kdy používat MySQL
Distribuované operace: Díky podpoře replikace je MySQL skvělou volbou pro distribuci databázového řešení, jako je primární-sekundární nebo primární-primární architektura.
Webové stránky a aplikace: MySQL je základem mnoha webových stránek a aplikací na internetu. Svůj díl na tom má snadná instalace, nastavení databáze a také rychlost a škálovatelnost.
Očekávaný budoucí růst: Podpora replikace databáze MySQL může usnadnit horizontální škálování. Kromě toho je poměrně snadné přejít na komerční verzi produktu.
Kdy nevyužiješ MySQL
Striktně stanovená pravidla: Databáze MySQL se nesnaží implementovat celý standard SQL, a tak s ním není zcela kompatibilní, což je v případě, kdy jej chceš využívat, zásadní překážkou.
Souběžnost a velké objemy dat: Přestože MySQL obecně funguje dobře při operacích náročných na čtení, souběžné čtení a zápis může být problematický ve chvíli, kdy data zapisuje více uživatelů najednou.
Co je to PostreSQL
PostgreSQL je výkonný objektově-relační databázový systém s otevřeným zdrojovým kódem. Využívá a rozšiřuje jazyk SQL o další funkce, které napomáhají bezpečně ukládat a škálovat nejsložitější datové úlohy.
Relační databázový systém PostgreSQL je oblíbený díky své osvědčené architektuře, spolehlivosti, integritě dat, robustní sadě funkcí, rozšiřitelnosti a nadšené komunitě. Databáze funguje na všech hlavních operačních systémech, od roku 2001 je kompatibilní s principy ACID a má řadu výkonných doplňků, o které se dá rozšířit.
Výhody PostgreSQL
Shoda s SQL: PostgreSQL podporuje 160 ze 179 funkcí požadovaných pro plnou shodu s jádrem SQL a jako bonus nabízí celou řadu volitelných funkcí.
Open-source a komunita: PostgreSQL je plně otevřený projekt, jehož zdrojový kód vyvíjí rozsáhlá komunita vývojářů. Ta udržuje a přispívá do mnoha online zdrojů, které popisují práci s databází, včetně oficiální dokumentace, wiki PostgreSQL a různých online fór.
Rozšiřitelnost: Uživatelé mohou databázi PostgreSQL programovat a rozšiřovat, protože je řízena katalogy a využívá dynamické načítání. Lze vybrat soubor s objektovým kódem, například sdílenou knihovnu, a PostgreSQL jej podle potřeby načte.
Nevýhody PostgreSQL
Výkon paměti: Každému novému procesu je přiděleno asi 10 MB paměti, což se u databází s velkým počtem připojení může rychle sčítat. Pro jednoduché operace náročné na čtení je proto PostgreSQL obvykle méně výkonná.
Oblíbenost: K dispozici je stále méně nástrojů třetích stran, které mohou pomoci spravovat databázi PostgreSQL.
Kdy použít PostgreSQL
Integrita dat je důležitá: PostgreSQL je od roku 2001 plně kompatibilní s ACID a implementuje multiverziální kontrolu změny dat (MVCC), která zajišťuje konzistentnost uložených dat, což z ní dělá dobrou volbu pro správu relační databáze, u nichž je integrita dat klíčová.
Integrace s dalšími nástroji: PostgreSQL je kompatibilní s celou řadou programovacích jazyků a platforem. Snáze tak databázi převedeš do jiného systému, nástroje nebo aplikace.
Složité operace: PostgreSQL podporuje plánování dotazů, které může využívat více procesů k rychlejšímu zodpovídání dotazů. Spolu s podporou více souběžných zapisovatelů je tato databáze skvělou volbou pro komplexní operace, jako jsou datové sklady či online zpracování transakcí.
Kdy PostgreSQL nepoužívat
Rychlost je nezbytně nutná: Na úkor rychlosti byla databáze PostgreSQL navržena s ohledem na rozšiřitelnost a kompatibilitu. Pokud tvůj projekt vyžaduje co nejrychlejší operace čtení, PostgreSQL nemusí být tou nejlepší volbou.
Jednoduché nastavení: Vzhledem k rozsáhlé sadě funkcí a důslednému dodržování standardního jazyka SQL může být PostgreSQL pro jednoduchá nastavení databáze příliš náročný.
Složitá replikace: Přestože PostgreSQL poskytuje silnou podporu replikace, jedná se stále o relativně novou funkci. Některé konfigurace (architektura primární-primární) je možné provádět pouze s vybranými rozšířeními.
Dá se vybrat správná databáze?
SQLite, MySQL a PostgreSQL jsou dnes tři nejpopulárnější open-source systémy pro správu relačních databází na světě. Každý z nich má své vlastní jedinečné vlastnosti a omezení a vyniká v určitých scénářích.
Správná volba je ovlivněna mnoha proměnnými a výběr je málokdy tak jednoduchý jako vybírání toho nejrychlejšího nebo toho s nejvíce funkcemi. Až budeš příště potřebovat řešení relační databáze, nezapomeň důkladně prozkoumat tyto a další nástroje, ať snáze najdeš ten, který nejlépe vyhovuje tvým potřebám.
Pokud se chceš dozvědět více o jazyce SQL a o tom, jak jej používat ke správě relační databáze, doporučujeme ti začít naším kurzem SQL, který ti pomůže se správou relačních databází.