Ayuda: Exportar

De Wikipedia, la enciclopedia libre
Ir a navegación Saltar a buscar

Las páginas wiki se pueden exportar en un formato XML especial para importarlas a otra instalación de MediaWiki o utilizarlas de otro modo, por ejemplo, para analizar el contenido. Consulte también m: Fuentes de distribución para exportar el resto de la información excepto las páginas, y consulte Ayuda: Importar sobre la importación de páginas.

Cómo exportar

Hay al menos seis formas de exportar páginas:

De forma predeterminada, solo se incluye la versión actual de una página. Opcionalmente, puede obtener todas las versiones con fecha, hora, nombre de usuario y resumen de edición.

Además, puede copiar la base de datos SQL. Así es como los volcados de la base de datos estaban disponibles antes de MediaWiki 1.5 y no se explicará más aquí.

Usando 'Especial: Exportar'

Para exportar todas las páginas de un espacio de nombres , por ejemplo.

1. Obtenga los nombres de las páginas para exportar

  • Vaya a Especial: Todas las páginas y elija el espacio de nombres deseado.
  • Copie la lista de nombres de página en un editor de texto
  • Ponga todos los nombres de las páginas en líneas separadas
  • Prefije el espacio de nombres a los nombres de las páginas (por ejemplo, 'Ayuda: Contenido'), a menos que el espacio de nombres seleccionado sea el espacio de nombres principal.

2. Realice la exportación

  • Vaya a Especial: exporte y pegue todos los nombres de sus páginas en el cuadro de texto, asegurándose de que no haya líneas vacías.
  • Haga clic en 'Enviar consulta'
  • Guarde el XML resultante en un archivo utilizando la función de guardado de su navegador.

y finalmente...

  • Abra el archivo XML en un editor de texto. Desplácese hasta la parte inferior para comprobar si hay mensajes de error .

Ahora puede utilizar este archivo XML para realizar una importación .

Exportando el historial completo

Una casilla de verificación en la interfaz Especial: Exportar selecciona si exportar el historial completo (todas las versiones de un artículo) o la versión más reciente de los artículos. Se devuelve un máximo de 1000 revisiones; se pueden solicitar otras revisiones como se detalla en MW: Parámetros a Especial: Exportar .

Formato de exportación

El formato del archivo XML que recibe es el mismo en todos los aspectos. Este formato está codificado en XML Schema en http://www.mediawiki.org/xml/export-0.6.xsd . Este formato no está diseñado para su visualización en un navegador web, aunque algunos navegadores le muestran XML bastante impreso con enlaces "+" y "-" para ver u ocultar las partes seleccionadas. Alternativamente, la fuente XML se puede ver utilizando la función "ver fuente" del navegador, o después de guardar el archivo XML localmente, con un programa de su elección. Si lee directamente la fuente XML, no será difícil encontrar el wikitexto real. Si no utiliza un editor XML especial, "<" y ">" aparecerán como & lt; y & gt ;, para evitar conflictos con las etiquetas XML; para evitar ambigüedades, "&" se codifica como "& amp;".

En la versión actual, el formato de exportación no contiene un reemplazo XML del marcado wiki (consulte Wikipedia DTD para una propuesta anterior o Wiki Markup Language ). Solo obtienes el wikitexto cuando editas el artículo. (Después de exportar, puede usar analizadores alternativos para convertir wikitexto a otro formato)

Ejemplo

  <mediawiki  xml: lang = "en" > 
    <page> 
      <title> Título de la página </title> 
      <! - código del espacio de nombres de la página -> 
      <ns> 0 </ns> 
      <id> 2 </id> 
      <! - Si la página es una redirección, el elemento "redireccionar" contiene el título de la página a la que se redirecciona -> 
      <redirect  title = "Redirigir título de la página"  /> 
      <restrictions> edit = sysop: move = sysop </restrictions> 
      <revision> 
        <timestamp> 2001-01-15T13: 15: 00Z </timestamp> 
        <contributor> 
          <username>Foobar </username> 
          <id> 65536 </id> 
        </contributor>
        <comment> ¡Solo tengo una cosa que decir! </comment> 
        <text> Un montón de [[texto]] aquí. </text> 
        <minor  /> 
      </revision> 
      <revision> 
        <timestamp> 2001-01-15T13: 10: 27Z </timestamp> 
        <contributor> <ip> 10.0.0.2 </ip> </contributor> 
        <comment > ¡nuevo! </comment> 
        <text> Una [[revisión]] anterior. </text> 
      </revision> 
      <revision> 
        <! - ejemplo de revisión eliminada -> 
        <id> 4557485 </id> 
        <parentid> 1243372 </ parentid> 
        <timestamp> 2010-06-24T02: 40: 22Z </timestamp>
        <contributor  deleted = "deleted"  /> 
        <model> wikitext </model> 
        <format> text / x-wiki </format> 
        <text  deleted = "deleted"  /> 
        <sha1 /> 
      </revision> 
    </page>
    
    <page> 
      <title> Charla: título de la página </title> 
      <revision> 
        <timestamp> 2001-01-15T14: 03: 00Z </timestamp> 
        <contributor> <ip> 10.0.0.2 </ip> </contributor> 
        <comment> hey </comment> 
        <text> ¡¡¡¿POR QUÉ BLOQUEAR LA PÁGINA ?? !!! estaba editando ese idiota </text> 
      </revision> 
    </page> 
  </mediawiki>

DTD

Aquí hay una versión corta y no oficial del formato de Definición de tipo de documento . Si no sabe qué es un DTD, ignórelo.

<! ELEMENT mediawiki (siteinfo?, Page *)> 
<! - version contiene el número de versión del formato (actualmente 0.3) -> 
<! ATTLIST mediawiki 
  versión CDATA #REQUIRED 
  xmlns CDATA #FIXED "http: // www. mediawiki.org/xml/export-0.3/ " 
  xmlns: xsi CDATA #FIXED" http://www.w3.org/2001/XMLSchema-instance " 
  xsi: schemaLocation CDATA #FIXED 
    " http://www.mediawiki.org /xml/export-0.3/ http://www.mediawiki.org/xml/export-0.3.xsd " 
> 
<! ELEMENT siteinfo (nombre del sitio, base, generador, caso, espacios de nombres)> 
<! ELEMENT nombre del sitio (#PCDATA) >       <! - nombre de la wiki -> 
<! ELEMENT base (#PCDATA)>           <! - url de la página principal -> 
<!Generador de ELEMENTOS (#PCDATA)>      <! - Cadena de versión de MediaWiki ->
<! ELEMENT case (#PCDATA)>           <! - cómo se manejan los casos en los nombres de las páginas -> 
   <! - valores posibles: 'first-letter' | La 
                         opción 'distingue entre mayúsculas y minúsculas' está reservada para el futuro -> 
<! ELEMENT namespaces (namespace +)>  <! - lista de espacios de nombres y prefijos -> 
  <! ELEMENT namespace (#PCDATA)>      <! - - contiene el prefijo del espacio de nombres -> 
  <! ATTLIST clave de espacio de nombres CDATA #REQUIRED>  <! - número de espacio de nombres interno -> 
<! ELEMENT página (título, id?, restricciones?, (revisión | carga) *)> 
  <! ELEMENT title (#PCDATA)>          <! - Título con prefijo de espacio de nombres -> 
  <! ID de ELEMENTO (#PCDATA)>  
  <!Restricciones de ELEMENTO (#PCDATA)>   <! - restricciones de página opcionales ->
<! ELEMENTO revisión (id?, Timestamp, contributor, minor?, Comment, text)> 
  <! ELEMENT timestamp (#PCDATA)>      <! - de acuerdo con ISO8601 -> 
  <! ELEMENT minor EMPTY>              <! - minor flag -> 
  <! ELEMENT comment (#PCDATA)>  
  <! ELEMENT text (#PCDATA)>           <! - Wikisyntax -> 
  <! ATTLIST text xml: space CDATA #FIXED "preserve"> 
<! ELEMENT contributor (( username, id) | ip)> 
  <! ELEMENT username (#PCDATA)> 
  <! ELEMENT ip (#PCDATA)> 
<! ELEMENT upload (marca de tiempo, contribuyente, comentario?, filename, src, size)> 
  <! ELEMENT filename ( #PCDATA)> 
  <! ELEMENT src (#PCDATA)> 
  <! ELEMENT size (#PCDATA)>

Procesando exportación XML

Muchas herramientas pueden procesar el XML exportado. Si procesa una gran cantidad de páginas (por ejemplo, un volcado completo) probablemente no podrá obtener el documento en la memoria principal, por lo que necesitará un analizador basado en SAX u otros métodos controlados por eventos.

También puede utilizar expresiones regulares para procesar directamente partes del código XML. Estos corren rápido pero son difíciles de mantener.

Enumere los métodos y herramientas para procesar la exportación XML aquí:

Detalles y consejos prácticos

  • Para determinar el espacio de nombres de una página, debe hacer coincidir su título con el prefijo definido en

/ mediawiki / siteinfo / namespaces / namespace

  • Las posibles restricciones son
    • sysop (páginas protegidas)

Ver también

Ayuda específica de Wikipedia