Thursday, June 12, 2008

Re: [pgsql-it-generale] to_tsvector: errori nella configurazione italiana

2008/6/13 Giorgio Valoti <giorgio_v@mac.com>:
Ciao Giorgio,

>>> test=> select to_tsvector('italian','prova');
>>> ERROR: invalid byte sequence for encoding "UTF8": 0xc3
>>> HINT: This error can also happen if the byte sequence does not match the
>>> encoding expected by the server, which is controlled by "client_encoding".
>>>
>>
>> whereas using english works fine:
>>
>>
>>> test=> select to_tsvector('english','prova');
>>> to_tsvector
>>> -------------
>>> 'prova':1
>>> (1 row)
>>>
>>
>> Danish's fine too, but not french (same error). All the .stop files
>> (italian, french, and danish) are utf8-encoded but maybe it doesn't matter,
>> I just don't know.
>>
>> I'm using the 8.3 version with Mac OS X 10.5.3 (pg server) and Mac OS X
>> 10.4.11 (psql client).
>
>

Senza saper ne leggere e ne scrivere questo errore mi puzza di import
da sql_ascii lontano un kilometro.

Il database su cui stai operando suppongo sia UTF8.
Sarebbe interessante capire come sono caricati questi dati e
l'encoding dell'eventuale database di origine.

Ad ogni modo prova la seguente procedura.
Esporta il database di origine con pg_dump passandogli l'opzione
--encoding=UTF8.
Converti il dump in utf8 con iconv
http://www.gnu.org/software/libiconv/documentation/libiconv/iconv.1.html
e caricalo in un altro database creato esplicitamente in UTF8.

Se la situazione e' come immagino ti sparira' l'errore ma ti
appariranno caratteri strani, sintomo di pastrocchi a livello
encoding.

Ciao
Fede


--
(all opinions expressed are my own)
Federico Campoli
PostgreSQL Consulting -> PGHost http://www.pghost.eu

--
Sent via pgsql-it-generale mailing list (pgsql-it-generale@postgresql.org)
To make changes to your subscription:
http://www.postgresql.org/mailpref/pgsql-it-generale

No comments: