Prije nekog vremena, nedugo nakon objave a vodič za Markdown, tražio sam informacije kako bih saznao može li se LibreOffice koristiti za izradu ovih vrsta dokumenata. Nisam našao ništa, osim odgovora tipa "zašto to želiš učiniti?" računati. Ideja je bila stvoriti dokument s uređivačem tipa Word ili Writer i zatim ga spremiti u .md formatu, ali kao što sam rekao; Nisam ništa našao. Nedavno je Microsoft izdao alat za nešto slično, a zove se MarkItDown.
MarkItDown je a python biblioteka koji se može instalirati na sustav — ne na Linux od Pythona 3.12 — ili u virtualnom okruženju (env). Nakon instalacije, osnovna ili raw uporaba zahtijevala bi pisanje nekoliko redaka u Pythonu, što imate ispod. Ali to nije jedini način da ga iskoristite.
MarkItDown pomoću Pythona
API je ovako jednostavan:
from markitdown import MarkItDown markitdown = MarkItDown() rezultat = markitdown.convert("test.xlsx") print(result.text_content)
Iz gornjeg, prvi redak uvozi biblioteku; drugi stvara kompatibilan objekt; U trećem izvodi pretvorbu — u datoteku koja se u primjeru zove text.xlsx — au četvrtom bi ispisao rezultat u konzoli. Nadalje, kako je objašnjeno u vaš GitHub, može se učiniti kompatibilnim s LLM-om kao što je ChatGPT, sve po ukusu potrošača i ovisno o znanju pojedinca.
Ako nam kôd nije najbolji, kreirao ga je programer po imenu Matt Palmer web olakšati zadatak. Iako je na engleskom, korištenje je vrlo jednostavno. Na dnu okvira prikazane su podržane datoteke, a to su PDF, PPTX, DOCX, XLSX, slike, audio, HTML i tekstualne datoteke. Jedina stvar koju ćemo morati učiniti je povući datoteku u okvir i pričekati da se dogodi magija, kao što se vidi na snimci zaslona zaglavlja.
U vrijeme pisanja postoji problem s preuzimanjem datoteke, koja prikazuje poruku o pogrešci umjesto teksta. Moguće je, nešto što nisam potvrdio, da to vidim jer sam kreirao datoteku iz Linuxa, LibreOfficea ili oba, ali vidim tu pogrešku prilikom preuzimanja datoteke. Dobro radi pretvorbu i uvijek možete kopirati čisti tekst koji generira, zalijepiti ga u tekstualnu datoteku i spremiti s nastavkom .md.
Za pregled, u Linuxu možemo koristiti alate kao što su Okular, Visual Studio Code ili neki program. ona je spremna, Među ostalima.
Uzeti u obzir
Iako je alat kreirao Microsoft, neće uvijek sve ići kako treba. Kako biste dobili najbolje rezultate, morate koristiti ispravne opcije. Na primjer, staviti a # Titular
o ## Título 2
, to morate odabrati u opcijama Word ili Writer. Isto je s uređenim ili neuređenim popisima, poveznicama, slikama... Ako umjesto ispravnih opcija odaberemo tekst i stavimo podebljani i veći font, Markdown ne radi tako, pa možemo dobiti mješovite rezultate. Za više informacija o podržanim markama, upućujemo vas na poveznicu koju ćete pronaći u prvom odlomku ove bilješke.
Sada je to službeni Microsoftov alat i možda je najbolja opcija za pretvaranje podržanih datoteka u Markdown.