Seuraa 
Viestejä19
Liittynyt2.4.2013

Hei,

Käytössäni on Linux käyttöjärjestelmä ja haluaisin kopioida ihailemani henkilö x-n kaikki vuosien varrella kertyneet huippuhyvät blokikirjoitukset serveriltä http://xxxx.puheenvuoro.uusisuomi.fi/ omalle koneelleni yhdeksi .pdf tiedostoksi.

Onnistuuko moinen ja millä komennoilla ja miten temppu tehdään?

Kiitos etukäteen.

Kommentit (9)

simson
Seuraa 
Viestejä124
Liittynyt22.3.2008

Avaa selaimella kukin blogikirjoitus yksitellen. Maalaa hiirellä haluttu teksti ja kopioi leikepöydälle. Avaa joku tekstinkäsittelyohjelma, esim Write ja kopioi teksti ohjelmaan leikepöydältä.

Yhteen Write dokumenttin voit liimata vaikka kaikki kirjoitukset peräkkäin.

Write dokumentin voi tallettaa sellaisenaan tai tulostaa jollain ilmaisohjelmalla pdf muotoon.

 

 

ilmaisin
Seuraa 
Viestejä1285
Liittynyt2.7.2005
simson

Avaa selaimella kukin blogikirjoitus yksitellen. Maalaa hiirellä haluttu teksti ja kopioi leikepöydälle. Avaa joku tekstinkäsittelyohjelma, esim Write ja kopioi teksti ohjelmaan leikepöydältä.

Yhteen Write dokumenttin voit liimata vaikka kaikki kirjoitukset peräkkäin.

Write dokumentin voi tallettaa sellaisenaan tai tulostaa jollain ilmaisohjelmalla pdf muotoon.

Aika työläs menetelmä. Jos ei ole mitään asiallista sanottavaa, niin saa myös olla hiljaa.

---
Seuraa 
Viestejä3439
Liittynyt6.9.2006

Eipä siihen taida mitään helppoa keinoa olla. Tosin jos ei niitä blogikirjoituksia nyt ihan mahdottomasti ole, niin ei tuollaisella copy paste konstilla hommaan kovin kauaa mene. Tosin tota leikepöytävaihetta en oikein ymmärrä, kun copy käsky siirtää ne suoraan sinne ja paste komento taas upottaa ne tekstinkäsittelyohjelmaan. Tietenkin se siinä välissä "kiertää" leikepöydän kautta, mutta käyttäjälle kyllä varsin näkymättömästi, eikä siihen tarvitse puuttua tai reagoida.

Joku luppoaikaa omaava ja asian osaava voisi suhteellisen helposti vääntää jonkun scriptin joka parsisi ne tekstit ja tallentaisi koneelle tekstimuotoon. Tietenkin hyvin tehty scripti kysyisi sen urlin alkuosan, joka yksilöi kenen blogi on kyseessä ja täten sillä voisi sitten kuka hyvänsä tallennella mieleisiään uuden suomen blogeja. Sen tekstitiedoston voi sitten avata vaikka Libreofficessa ja tallentaa pdf muotoon.

mukka
Seuraa 
Viestejä19
Liittynyt2.4.2013

Kiitos tähänastisista vastauksista.

Kiitos vinkeistä. Tähän asti olen toteuttanut homman juurikin copy/paste-lla tai niin että olen tulostanut jokaisen sivun erilliseksi .pdf tiedostoksi. Aika työläitä molemmat koska bloki kirjoituksia oli kymmeniä.

Kyseessä olisi tälläkertaa varsin tuottelias tiedemies tai oikeastaan useampikin joille on kertynyt kirjoituksia usean vuoden aikana useita satoja kullekkin ja jostakin syystä tuntuu että hänen/heidän jokainen plokikirjoitus on jonkun tason aarre ja olisi ehdottomasti säilömisen arvoisia.

Sikäli koko juttu on vähän hassu sillä automaattinen itsestään selvä oletushan on että eihän ne vaivalla kirjoitetut aarteet sieltä serveriltä mihinkään häviä ja että sieltä ne on milloin vain luettavissa. Todellisuudessa olen huomannut että ei se niin mene. Blokisti voi milloin vain vetää kirjoituksensa pois ja sinne meni. Koko palsta voidaan sulkea ja sinne meni.

Katsotaan vaan niin kyllä tähänkin temppuun löytyy joku kätevä komentorimpsu. Terminaaliin copy/pastella joku maaginen rimpsu jota hieman muokataan ja koko homma hoituu käden käänteessä.

 

 

---
Seuraa 
Viestejä3439
Liittynyt6.9.2006

Kyllä se vaatii ihan sivustokohtaisen "parserin", jos haluaa talteen vain otsikon ja itse kirjoituksen ilman mitään muuta tauhkaa. Ei siis ole mitään maagista komentorimpsua millä se onnistuisi aina ja kaikkialla, sen verran erilaisilla tekniikoilla ja tavoilla tuollaisen sivuston voi toteuttaa.

Yksittäisen sivun voi tietenkin ladata offlineen, mutta se on ihan yhtä työlästä kuina tuo copy pasteaminenkin loppuviimein.

Vierailija

http://www.gnu.org/software/wget/manual/wget.html#Recursive-Download

elikkäs taitaisi olla mahdollista ladata kertalaakista ne kaikki blogikirjoitukset.

Mutta siitä eteenpäin onkin sitten toinen juttu. Joutunee käsipelillä muuttamaan hötömöllöt peedeeäffäksi ellei sitten löydy jotain sopivaa automaatio-työkalua. Periaatteessa olisi niinkin simppeli juttu että automaatio-työkalulla 1. käsketään selainta/tekstinkäsittelyä/whåtever lataamaan käsittelyvuorossa oleva tiedosto  2. käsketään printtaamaan pdf-muotoon em. ladattu tiedosto . Ja sitten jossain skriptissä iteroidaan tuota automaatio-työkalua kunnes kaikki tiedostot ovat käsitelty. Tosin nyt ei kyllä ihan heti tule mieleen mitään sopivaa. Olis kyllä itselläkin ollut aikoinana tarvetta jollekin tuollaiselle kun kävi duunissa tympimään käsipelillä muutella openofficella kirjoitettua dokumentaatiota pdf-muotoon että olisi varmasti tasan tarkkaan pikseli pikseliltä saman näköinen dokumentti sekä linukalla että wintöötillä avattaessa.

No periaattteessa tästä vois olla jotain apua:

http://www.google.fi/search?q=automation+testing+tools+for+linux

tuon haun kautta löytyy esms: http://en.wikipedia.org/wiki/Linux_Desktop_Testing_Project

---
Seuraa 
Viestejä3439
Liittynyt6.9.2006

Kaikista nykyisistä vaihtoehtdoista vähiten työläs on copy paste. Jos haluaa automatisoida, pitää ihan itse koodata joku rimpula joka osaa parsia saitilta annettujen ehtojen mukaisesti vain tietyn osan ja vielä kyseisen blogikirjoittajan jokaisesta blogista, räpeltää ne peräkanaan ja tehdä niistä vaikka txt. Se on sitten muutaman klikkauksen päässä siitä, että se on pdf. 

lokki
Seuraa 
Viestejä4899
Liittynyt3.1.2010

Kokeile Web to PDF sivustoja.

http://www.webtopdf.net/

https://pdfburger.com/web-to-pdf

jne.

Tekevät webbisivusta näköispainoksen pdf-muodossa. Nettiosoite ruutuun ja talletetaan pdf-muodossa omalle koneelle. Tuo jälkimmäinen on erittäin yksinkertainen. Ei tarvitse muuta, kuin nettiosoitteen, josta löytyvän sivun se muuntaa pdf-tiedostoksi, jonka voi ladata omalle koneelleen 6 tunnin sisällä.  Ei minusta kovin vaikeaa tai työlästä.

Suosituimmat

Uusimmat

Uusimmat

Suosituimmat