Ciao Giorgio,
>>> test=> select to_tsvector('italian','prova');
>>> ERROR: invalid byte sequence for encoding "UTF8": 0xc3
>>> HINT: This error can also happen if the byte sequence does not match the
>>> encoding expected by the server, which is controlled by "client_encoding".
>>>
>>
>> whereas using english works fine:
>>
>>
>>> test=> select to_tsvector('english','prova');
>>> to_tsvector
>>> -------------
>>> 'prova':1
>>> (1 row)
>>>
>>
>> Danish's fine too, but not french (same error). All the .stop files
>> (italian, french, and danish) are utf8-encoded but maybe it doesn't matter,
>> I just don't know.
>>
>> I'm using the 8.3 version with Mac OS X 10.5.3 (pg server) and Mac OS X
>> 10.4.11 (psql client).
>
>
Senza saper ne leggere e ne scrivere questo errore mi puzza di import
da sql_ascii lontano un kilometro.
Il database su cui stai operando suppongo sia UTF8.
Sarebbe interessante capire come sono caricati questi dati e
l'encoding dell'eventuale database di origine.
Ad ogni modo prova la seguente procedura.
Esporta il database di origine con pg_dump passandogli l'opzione
--encoding=UTF8.
Converti il dump in utf8 con iconv
http://www.gnu.org/software/libiconv/documentation/libiconv/iconv.1.html
e caricalo in un altro database creato esplicitamente in UTF8.
Se la situazione e' come immagino ti sparira' l'errore ma ti
appariranno caratteri strani, sintomo di pastrocchi a livello
encoding.
Ciao
Fede
--
(all opinions expressed are my own)
Federico Campoli
PostgreSQL Consulting -> PGHost http://www.pghost.eu
--
Sent via pgsql-it-generale mailing list (pgsql-it-generale@postgresql.org)
To make changes to your subscription:
http://www.postgresql.org/mailpref/pgsql-it-generale
No comments:
Post a Comment