Statusuppdatering 2017-03-09 kl 16.10 - 2008 - 2023 års Järnvägshistoriska forum

Databasen är i lite sämre skick än vad jag först trodde. Det innebär dels att reparationen är lite mer invecklad än förväntat samt att det finns en risk att ett mindre antal konstiga tecken kan komma att finnas kvar i databasen efter reparation.

En dator lagrar data som ett antal tal, där varje tal är 0 - 255. Tecken, alltså bokstäver, siffror och symboler, utgörs av ett eller flera tal, beroende på vilken teckenkodning man använder. Tidigare var teckenkodningen Latin1 eller ISO-8859-1 vanlig i Sverige men nu håller man på att gå över till UTF-8. Latin1 använder ett tal för ett tecken medan UTF-8 använder ett eller flera tal för ett tecken.

I databasen är nu vissa tecken kodade med Latin1 medan andra tecken i databasen är kodade som UTF-8. Men det visar sig att det även finns tecken i databasen som har en helt felaktig kodning.

De tecken som är kodade korrekt som antingen Latin1 eller UTF-8 har jag koll på men det jag behöver göra nu är att reparera de tecken som har en helt felaktig kodning.

Med vänlig hälsning
Daniel