Převod blogu, aneb proč nám to trvá (či trvalo) tak dlouho

Převod blogu z blog.cz na WordPress či Blogspot stále funguje a při posledních větších problémech této blogovací platformy se vás na nás obrátilo poměrně hodně (17, z toho 12 je úspěšně převedeno, vizte přehled převedených blogů v původním článku). Ti z vás, kterým už jsme stihli odpovědět, tuto informaci dostali hned v naší první reakci. Několika z vás odpověď či rovnou převod ještě dlužíme, ale nebojte se, vyřešíme to i s vámi. :)

Tento článek píšu z části pro zajímavost, z části kvůli tomu, abyste věděli, že na to nekašleme, a z části také proto, že už jsem (nejen) kvůli převodům prakticky měsíc a půl na svoje blogy nic nepřidala a dost mi to chybí. Přece jenom jsem si zajela jistou pravidelnost jak na tomto blogu (jednou týdně výlet a sem tam něco jiného), tak na dveruce.cz (jednou až dvakrát týdně nápady pro děti – aktivity, tvoření, vzdělávání, návody, atd.). Pár dalších webů spravuju a na některé z nich také občas přispívám, nicméně i to muselo jít stranou. Jednoduše – veškerý čas, který jsem měla vyhrazený na blogování, byl věnován všem možným blogům, jen ne těm mým.

Nicméně musím dodat – nestěžuji si. Nestěžujeme si ani jeden. Naopak.

Proč to vlastně děláme

Přestože můj blog nepatří mezi ty nejznámější, píšu už hodně dlouho (od roku 2006). Můj prapůvodní (ještě starší) počin provozovaný pod stránkou sblog.cz jednoho dne zmizel a já se proto sebrala, na popud Martina si založila free hosting, nahodila na něj WordPress a od té doby mám klid, resp. zejména od té doby, kdy jsem před 10 lety přesídlila na placený hosting a vlastní doménu. Neděsí mě, že o blog přijdu jen proto, že platforma, na které běží, z ničeho nic službu zruší. Můžu si dělat zálohy a taky si je dělám. A taky moc dobře vím, že to na blogu.cz nejde.

Za těch 14 let jsem sledovala spousty blogů a valná většina z nich už neexistuje. Posledních pár let blogování netáhne jako dřív a ti, kteří si blog dneska zakládají, to většinou dělají za jiným účelem, než je sdílení myšlenek, zkušeností a fotek bez vize výdělku a bez reklamy. Na blogu.cz se ale většinou najdou právě ty nekomerční blogy, s jejichž obsahem si dávají jejich autoři práci ne pro peníze, ale prostě proto, že je to baví. Na rozdíl od běžných uživatelů matlafonů, kteří informace jen pasivně získávají, také takoví lidé přemýšlí, což je také třeba podporovat.

Blog.cz se ale dlouhodobě potýká s problémy, což vědí všichni, kteří s ním za poslední dobu měli něco společného. Mnozí se obávají, že jednoho dne prostě zmizí, aniž by svým uživatelům nabídl možnost přenést svůj obsah jinam. Mnozí také z pochopitelných důvodů nechtějí začínat jinde od začátku. A právě to nás přivedlo na nápad tohle celé vymyslet. Je přece škoda, aby někdo přestal psát jen kvůli tomu, že jeho blogovací platforma neumožňuje export dat jinam.

Jak to celé funguje “za oponou”

Několik z vás se na různých místech zmínilo, že nemá ponětí, jak to celé probíhá, co se při tom děje a že je přinejmenším zajímavé, že z ničeho nic mají v jednom či několika souborech zálohu celého blogu. Řekli jsme si proto, že vám můžeme trochu přiblížit, co se děje poté, co od vás obdržíme mail s adresou stávajícího blogu.

HTML, XML

Skript Blogcz2WP je napsaný tak, že čte stránku blogu v HTML podobě. Ta je volně přístupná a podívat se na ni můžete i vy (např. ve Firefoxu a Chromu stačí na libovolné stránce stisknout CTRL+U). Jednotlivé HTML tagy od sebe mj. oddělují různé části článku jako je nadpis, datum, autor, jednotlivé odstavce a stejně tak i části komentářů. Tagy se opakují, jsou předvidatelné a lze s nimi dále pracovat. Exportní soubor zasíláme ve formátu XML, což je další značkovací jazyk. XML umožňuje poměrně snadný převod dat mezi různými systémy a WordPress i Blogspot berou soubory se zálohou v tomto formátu. Obě platformy však mají svůj systém a vyžadují odlišné XML formátování. Soubor se zálohou pro WordPress jsme proto obkoukali a převzali. potřebené tagy použili a obalili do nich data dostupná v HTML podobě na blogu.cz.

Stažení

Jakmile skript spustíme, jako první proběhne soupis článků podle údajů v archivu. Ten je pak ještě pro jistotu na více místech kontrolován. Následuje stažení jednotlivých článků z blogu – skript prochází dle soupisu jeden článek za druhým, bere z něj potřebná data (ta volně dostupná v HTML) a ukládá je s příslušnými tagy do XML souboru. Strojově se tak provede totéž, jako byste kopírovali údaj po údaji a vkládali je na jinou platformu do příslušných políček.

Skript také umí vyhledat všechny interní odkazy a změnit je z absolutních na relativní. To znamená, že všechny odkazy povedou automaticky na příslušné články, ale už na novém umístnění. Totéž může provést i s obrázky. Pokud nastane nějaká chyba se stahováním, zpravidla se to dozvíme hned a skript vypíše chybovou hlášku.

Takto to vypadá, když skript běží:

Obrázky

Obrázky následně stahujeme zvlášť (skript vytvoří jejich soupis).

Import

Výsledný soubor je možné rovnou nahrát do WordPressu. U Blogspotu je potřeba jej ještě zkonvertovat přes další program, který není náš. Primárně jsme tuto službu zařizovali pro migraci na WordPress a na Blogspot to funguje prakticky výhradně díky onomu programu.  Veškerý postup každému popisujeme do e-mailu.

Proč nám to teď tak dlouho trvá

Na to je jednoduchá odpověď – napsalo vás mnoho najednou. :) Když se sem tam ozval jeden člověk, byli jsme schopni vyřídit export během pár dnů se vším všudy včetně následné podpory, pokud byla nutná, a také včetně vyřešení případných chyb a problémů. Když se sejde více exportů, zákonitě se musí objevit i více problémů a do jejich řešení nám házely klacky pod nohy naše ostatní povinnosti (= málo času na všechno). Musím přiznat, že jsme tohle nečekali a taky nás to pěkně zazdilo.

Drobný problém se objevil téměř u každého blogu a my se snažili rovnou předcházet dalším stejným výskytům, což také zabralo nějaký čas. Sem tam se objevily i problémy většího rozsahu a někdy to přerostlo až v řešení něčeho, co se samotným exportem blogu vlastně nesouvisí. I tam jsme pomohli, bylo-li to v našich silách. :)

Blog si můžete stáhnout i sami

V současné době je program blogcz2WP volně k dispozici na Martinově GitHubu. Pokud na blog nechcete čekat a zvládnete obsluhu skriptu (jedná se o konzolovou aplikaci bez grafického rozhraní), případně máte v okolí někoho, kdo to zvládne, je vám k dispozici za podmínky, že jej užijete pouze k exportu vlastního autorského obsahu. Návrhy na vylepšení, upozornění na chyby a případně odvozený vývoj jsou vítány.

Pár slov na závěr

Díky všem (např. , kdo všude možně, kde to bylo vhodné, sdíleli mimo jiné rady i odkaz na nás. Zřejmě i díky vám se o tom dozvěděli ti, kterým to fakt pomohlo. :)

Všem, kteří čekali nebo ještě čekají na svůj export nebo jinou odpověď od nás, díky za trpělivost a pochopení!

Pokud vám dlužíme odpověď a přijde vám, že jsme se neozvali už fakt dlouho, klidně se připomeňte.