Sunday, December 20, 2009

Verbetering van zoekresultaten


Als schrijver op twee blogs zie ik dat veel bezoekers die via een zoekmachine komen (99% via Google) vaak niet naar het juiste artikel gestuurd worden en daardoor meteen afhaken. Zoekmachines zoeken niet in de afzonderlijke blog artikelen maar indexen vaak de hele blog in een keer. Hierdoor kunnen de gezochte termen uit meerdere artikelen komen. Als gevolg daarvan krijgt de gebruiker in de zoekresultaten een link naar één van de artikelen in de blog. Of die link naar het "juiste" artikel verwijst is vaak een kwestie van geluk hebben en vaak gaat dat mis. In de meeste gevallen verwijst de link in de zoekresultaten echter naar de hoofdpagina van de blog.

Het probleem
In een bericht op de Google support site heb ik een voorstel gedaan. Als de zoekopdracht meerdere zoektermen bevat, worden die zoektermen in de regels eronder vet afgedrukt. Zo zocht er laatst iemand naar "snomed CT alternatieven". Op mijn innovatie blog staat een artikel over SNOMED CT* én een artikel over software alternatieven voor bekende programma's. De gebruiker was volgens mij op zoek naar eventuele alternatieven voor SNOMED omdat dit systeem gelicenceerd is. Het zoekresultaat geeft echter een link naar het artikel over software alternatieven en niet naar het artikel over SNOMED CT. Dit schijnt een bekend probleem te zijn.
Dit is het oude resultaat:

Robert's Technologie en Innovatie blog: Software alternatieven vinden

De website geeft alternatieven voor Windows, Mac en Linux. ... Slimme electriciteitsmeters ·SNOMED CT en kleurcodering van medicijnen ... ilbrinkinnovatie.blogspot.com/.../software-alternatieven-vinden.html

Waarom er ook iets tussen staat over slimme elektriciteitsmeters is mij een volslagen raadsel. Ik heb wel iets geschreven over die dingen maar in deze zoekopdracht horen ze echt niet thuis.

Voorstel:
Een paar dagen geleden heb ik naar Google toe een voorstel gedaan. Ik weet niet of mijn voorstel al "jaren" bekend is of niet. Het voorstel is: plaats als er meerdere zoekwoorden zijn, links in elk van de gevonden woorden. Het ziet er dan zo uit:

Robert's Technologie en Innovatie blog: Software alternatieven vinden

De website geeft alternatieven voor Windows, Mac en Linux. ... Slimme electriciteitsmeters ·SNOMED CT en kleurcodering van medicijnen ... ilbrinkinnovatie.blogspot.com/.../software-alternatieven-vinden.html

De vet geschreven woorden zijn nu links naar de artikelen waar ze in voor komen.

De gebruiker kan nu zelf kiezen welk woord in het zoek resultaat het belangrijkste is en waar de link naar toe leidt.

Hoe we het probleem bij plaatjes gaan oplossen is nog niet duidelijk. Bijna alle zoek resultaten op plaatjes komen op de hoofd pagina's van mijn blogs uit en niet zoals je zou willen op het specifieke artikel zelf.

Eigenlijk wel gek dat Google zelfs haar eigen blogs niet eens goed, artikel voor artikel, indexeert.

* SNOMED CT is een methode om de registratie van medische gegevens te vereenvoudigen en te standardiseren waardoor gegevens gemakkelijker vergeleken kunnen worden, ziekenhuis resultaten vergeleken kunnen worden en ook onderzoeken op grote schaal (regionaal, landelijk, internationaal) gedaan kunnen worden.

Thursday, December 17, 2009

Video uit de oude doos


Het is leuk om te zien waar we in 1983 mee bezig waren. Een Amerikaanse uitzending over wat je voor de computer nerd van 1983 kon kopen. Aan het einde zie je een voorloper van de Psion 3a (volgens mij nog steeds de beste organizer) of de Toshiba Libretto, dat hele kleine laptopje dat je zo in je colbert kon mee nemen.


Wednesday, December 16, 2009

Lange bestandsnamen inkorten, How to shorten long file names


Als ik via Juice podcasts download zitten er vaak bestanden bij met een gigantisch lange naam. Het laatste deel van de bestandsnaam zijn tracking markers. Mijn MP3 spelers (allemaal iRivers) kunnen die extreem lange bestandsnamen niet aan. Het gevolg is dat ze als er een lange bestandsnaam op staat die iRivers continue in een reboot loop komen. Dan moet ik ze weer even via de USB kabel aansluiten om de lange bestandsnamen in te korten.

Die bestanden zien er dan ongeveer zo uit:
PodcastBestand_nvb_20091207174750_nva_200912081757.mp3
met heel veel "nva" en "nvb" referenties.

Sinds enige tijd gebruik ik nu FileNameFixer. Dit programmatje kun je instellen op een vaste directory en een maximale bestandslengte. Nadat alle MP3 bestanden in één directory zijn verschoven (bij Juice in het [Preferences]-[Advanced] gedeelte met het volgende script: move "%f" "C:\Podcasts\TempFiles\") laat ik eerst FileNameFixer zijn werk doen alvorens een batch scriptje te draaien die alle podcasts op de zelfde geluidssterkte zet. Dat scriptje ziet er zo uit:

"C:\Program Files\MyPrograms\mp3gain.exe" /r /d -4 /c /p C:\Podcasts\TempFiles\*.mp3
Move /Y C:\Podcasts\TempFiles\*.mp3 C:\Podcasts\LevelledFiles\
Move /Y C:\Podcasts\TempFiles\*.* C:\Podcasts\RemainingFiles\
%windir%\System32\rundll32.exe powrprof.dll,SetSuspendState

De eerste regel start het programma mp3gain in command line mode en loopt alle zojuist gedownloade podcasts door om ze allemaal het zelfde geluidsniveau te geven. Daarna worden alle MP3 bestanden gekopieerd naar LeveledFiles en alle overige files (meestal video bestanden of PDF's) naar RemainingFiles. Het laatste commando zet de PC in slaap. Soms gebruik ik op de laatste regel: shutdown.exe -s -f als ik de PC na afloop wil laten afsluiten.

UPDATE: Omdat ik alles via een script wilde laten werken heb ik het inkorten van lange bestandsnamen als DOS script uitgewerkt. Ga naar het volgende artikel om te lezen hoe je dit automatisch in DOS kunt doen: Podcast-manipulatie-script

Cutting long podcast file names.
Some podcasts have long tracking postfixes in their file names which makes my iRivers contstanly reboot. A few months ago, I added an extra step in my download procedure.
I download the podcasts with Juice and within Juice I automatically copy all the files to one central directory (in Juice [Preferences]-[Advanced] add the following script: move "%f" "C:\Podcasts\TempFiles\"). Then I use FileNameFixer to automatically cut the long file names to a maximum length of 60 characters (with a default directory of C:\Podcasts\TempFiles and a default file length of 60). Ater that I run the script above to make sure all audio levels are the same, as I hate these huge variations in recording levels between different podcasts. After processing the mp3 files, the mp3's are copied to LeveledFiles and the remaining files (mostly video and pdf's) are copied to RemainingFiles. The last command line puts the PC in suspend (sleep) mode as I often run the mp3gain script at night.

UPDATE: Since I want to run everything in a script, I created a DOS script to automatically reduce long file names to a fixed maximum length. To read more about this script follow this link: Podcast manipulation script

Thursday, December 10, 2009

Meer dan drie kolommen sorteren in Excel


In excel kun je standaard op drie zaken tegelijkertijd sorteren.
Op meer dan drie kolommen tegelijkertijd sorteren kan heel gemakkelijk als je het volgende trucje gebruikt.

Stel je wilt de rijen 1 t/m 20 sorteren op basis van de gegevens in de kolommen A t/m G (7 kolommen).
Naast de laatste kolom G creeer je een extra sorteer kolom (in dit geval kolom H). In Cell H1 plaats je de volgende formule:

Voor de Engelse versie =CONCATENATE(A1,B1,C1,D1,E1,F1,G1)
Voor de Nederlandse versie =TEKST.SAMENVOEGEN(A1;B1;C1;D1;E1;F1;G1)

Kopieeer de formule van cell H1 naar H2 t/m H20.

Sorteren doe je nu door op kolom H te sorteren. Mocht je eerst op kolom B en dan op kolom G willen sorteren, dan pas je gewoon de volgorde in het samenvoegen aan (B1;G1;A1;C1;D1;E1;F1).

Als je ook een deel van de kolommen omgekeerd wilt sorteren, maak je (maximaal) 3 sorteer kolommen met samengevoegde tekst strings. B.v. kolom H is vooruit sorteren, kolom I is achteruit sorteren en kolom J is voor het laatste gedeelte vooruit sorteren. In het standaard sorteer dialoogvenster kies je dan de drie kolommen. Voor kolom I selecteer je dan omgekeerde sorteer volgorde.