Thursday, September 18, 2008

[pgsql-es-ayuda] Problemas con pg_dump, mediawiki y encodings.

Hola, les escribo por un detalle que estamos teniendo a la hora de hacer restauraciones a partir de dumps de una base de datos de MediaWiki con pg_dump en PostgreSQL 8.1.11. Los dumps los hemos realizado tanto en texto plano como comprimidos, pero de ninguna forma hemos podido hacer el restore. El error que surge siempre es similar al siguiente:

ERROR:  secuencia de bytes no válida para codificación «UTF8»: 0x94

Los errores surgen principalmente al insertar datos sobre la tabla mediawiki.text, la cual contiene el código tipo MEDIAWIKI de cada página alojada en la wiki en cuestión.

Al revisar los archivos del dump, se puede observar que la mayoría de los caracteres especiales alojados en él se encuentran con el signo (�). Dentro de la wiki original se pueden ver los caracteres especiales sin ningún problema. Las BDs se encuentran con codificación UTF8, tanto la original, como la que queremos restaurar.

Cualquier ayuda que me puedan dar con respecto a esto será bastante agradecida.

Saludos, Luis Garcia.

--
Luis D. García M.

Telf: (+58) 2418662663
Cel.: (+58) 4143482018

No comments: