Como formatar documentos vindos do Word, LibreOffice e Google Docs no SEI?

Se você utiliza o editor de texto MS-Word para escrever seus documentos e depois copia e cola o conteúdo diretamente no SEI, você pode estar tendo problemas de formatação e dificuldades em usar os estilos do SEI, tais como o texto justificado, texto alinhado à direita ou texto alinhado à esquerda.

Isso ocorre porque o MS-Word utiliza um tipo de linguagem de código para composição dos documentos que não é compatível com o SEI. A codificação do MS-Word é feita em uma linguagem proprietária da Microsoft, ou seja, é uma linguagem que não pode ser usada em softwares livres ou de código aberto, pois é de propriedade da Microsoft. 

O SEI, por ser um software governamental de código aberto e usado por uma grande parte dos órgãos públicos, não pode utilizar a mesma linguagem usada pela Microsoft, pois a linguagem também precisa ser de uso livre ou de código aberto. 

A linguagem para codificação de documentos no SEI é o Hypertext Markup Language (HTML), que é uma linguagem livre e consagrada, para marcação e formatação de textos, a qual vem sendo utilizada desde os primórdios da internet.

O mesmo problema pode ocorrer ao usar outros editores de texto, tais como o LibreOffice e Google Docs, embora este último seja baseado em HTML e, por isso, mais compatível com o editor do SEI.

Assim, se você deseja copiar e colar seus textos diretamente do seu editor de texto preferido para o editor de texto do SEI, você tem três opções:

  1. usar a opção correta de exportação HTML do seu editor de textos preferido para o editor do SEI;
  2. usar a opção de copiar e colar especial no editor do SEI, porém isso fará com que você perca a formatação original que estava no seu editor de texto preferido;
  3. usar um editor de texto que tenha como base o HTML, tais como  Editores WYSIWYG, que são usados para construção de páginas web e sites. Você pode ver um exemplo desse editor na W3 School. Porém, não há editores de textos robustos como MS-Word, LibreOffice e GDocs que usem esse tipo de formatação.

Caso você continue colando o conteúdo de um editor de texto que não usa a linguagem HTML dentro do editor do SEI, você continuará tendo problemas com a formatação dos documentos no SEI.

Agora, vamos mostrar como você pode proceder para manter parcialmente ou até integralmente a formatação ao migrar seus textos dos editores de texto acima citados para o editor do SEI, por meio de exportação ou de copy-paste.

Recomendações importantes antes de iniciar

Antes de migrar o seu conteúdo do seu editor de texto preferido para o editor do SEI, siga estas recomendações importantes:

  1. Caso seu conteúdo tenha imagens, ao inserir estas imagens no seu conteúdo, salve-as em formato JPG ou PNG, pois será necessário inserir as imagens em um desses formatos individualmente no SEI, pois o editor do SEI não aceita que você cole as imagens diretamente no editor, sem que ela seja um arquivo de imagem.

  2. Caso seu conteúdo tenha tabelas, saiba que elas serão convertidas para o SEI com uma formatação simplificada. Será necessário revisar os conteúdos para garantir que estejam corretos.

A seguir, mostraremos como fazer o copiar e colar (copy-paste) de forma a perder o mínimo de formatação possível do seu editor de texto preferido para o SEI.

Do MS-Word para o SEI

O Microsoft Word é um processador de texto com seu próprio formato de arquivo (.docx), que utiliza codificação proprietária da Microsoft, baseada em linguagem C++ e XML e, portanto, não é baseado em HTML

O formato .docx do MS-Word usa um formato complexo que armazena informações sobre texto, formatação, imagens e outros elementos. Além disso, ele apresenta uma formatação rica, oferecendo uma ampla gama de opções de formatação, incluindo estilos, tabelas, imagens e customizações que não podem ser facilmente convertidas para o formato HTML.

O que acontece ao copiar e colar do MS-Word para o SEI?

  • Resultados variáveis: Os resultados podem variar dependendo da complexidade do conteúdo e do editor HTML;
  • Perda de formatação: A formatação complexa do Word, como estilos personalizados e layouts avançados, geralmente não é transferida corretamente para o HTML;
  • Código HTML "sujo": O Word pode gerar código HTML complexo e "sujo" que pode ser difícil de editar e manter. Isso ocorre porque o word tenta converter o máximo da formatação possível, e por vezes essa conversão gera um código extenso e desnecessário;
  • Imagens e tabelas: Imagens e tabelas podem ser copiadas, mas a formatação e o layout podem não ser preservados.

No entanto, o MS-Word apresenta ferramentas de exportação que permitem a conversão do documento em HTML.

Opções para exportar do MS-Word para o SEI

  • Salvar como HTML: O Word para Desktop oferece a opção de salvar documentos como páginas da Web (.html). No entanto, o código HTML gerado pode ser complexo e precisar de edição;
  • Converter para HTML: Existem ferramentas online e softwares que podem converter documentos do Word para HTML de forma mais limpa. Caso você utilize o Word Online (Microsoft 365 no navegador)deverá usar esta opção.

Salvar MS-Word como HTML

Vamos ver o passo a passo para exportar um documento em MS-Word para o formato HTML aceito no SEI, enfatizando que essa opção só pode ser realizada na versão Desktop do software, não é possível exportar para HTML usando o Word Online (Microsoft 365 no navegador):

  1. Após editar seu documento no MS-Word, entre em Arquivo > Salvar uma cópia > Selecione o local de salvamento > Determine o tipo de arquivo para Página da Web (*.htm;*.html) > Salve o documento;
    formatar-word-sei-exportar-word-01.jpg
  2. Abra o documento salvo com extensão .html no seu navegador;
  3. Copie o conteúdo do arquivo e cole no editor do SEI;
  4. Revise os conteúdos para ver se tudo correu bem, especialmente as tabelas;
  5. Corrija o necessário;
  6. Ao tentar salvar o documento no editor do SEI, caso haja imagens no seu conteúdo, você receberá uma mensagem “Não são permitidas imagens referências”. Nesse caso, você precisará deletar todas as referências de imagens e inserir novamente as imagens a partir dos arquivos JPG ou PNG, seguindo os procedimentos da seção “Tratar Imagens do Documento”;
  7. Após tratar as imagens, salve o documento no editor do SEI;
  8. Salve o documento no SEI.

Converter MS-Word para HTML

Caso você esteja utilizando o Word Online (Microsoft 365 no navegador), não será possível exportar o arquivo doc ou docx para o formato HTML. Nesse caso, você precisará converter o arquivo usando uma ferramenta on-line que faz a conversão de arquivos.

Para converter um arquivo doc ou docx para html, você pode usar diversas ferramentas que estão disponíveis on-line, as quais você pode pesquisar em um buscador on-line usando os termos “converter word para html”.

Em qualquer uma das ferramentas, você pode seguir este passo a passo básico:

  1. No MS-Word, baixe uma cópia do documento em formato docx para o seu computador ou dispositivo móvel;
  2. Abra a ferramenta on-line da sua preferência;
  3. Arraste ou faça upload do seu arquivo para a ferramenta on-line;
  4. Clique no botão para converter em HTML;
  5. Salve o arquivo HTML no seu computador ou dispositivo móvel;
  6. Abra o arquivo HTML no navegador;
  7. Copie o conteúdo;
  8. Cole no editor do SEI;
  9. Revise os conteúdos para ver se tudo correu bem, especialmente as tabelas;
  10. Corrija o necessário;
  11. Ao tentar salvar o documento no editor do SEI, caso haja imagens no seu conteúdo, você receberá uma mensagem “Não são permitidas imagens referências”. Nesse caso, você precisará deletar todas as referências de imagens e inserir novamente as imagens a partir dos arquivos JPG ou PNG, seguindo os procedimentos da seção “Tratar Imagens do Documento”;
  12. Após tratar as imagens, salve o documento no editor do SEI;
  13. Salve o documento no SEI.

Do LibreOffice para o SEI

O LibreOffice é um conjunto de aplicativos de escritório de código aberto, e sua base é bastante diversificada em termos de linguagens de programação. Ele utiliza linguagens de programação, tais como C++ (parte central do programa), o Java (extensões e algumas funcionalidades específicas), Python (ferramentas e scripts) e o LibreOffice Basic (criação de macros e automação de tarefas). Portanto, embora seja um software de código aberto, assim com o MS-Word, ele não é compatível com HTML.

O que acontece ao copiar e colar do LibreOffice para o SEI?

  • Resultados variáveis: assim como no MS-Word, copiar e colar diretamente do LibreOffice Writer (o processador de texto) para o editor do SEI pode levar a resultados inconsistentes. A formatação complexa pode não ser preservada, e o código HTML gerado pode ser "sujo" ou excessivamente detalhado;
  • Exportação para HTML: O LibreOffice Writer oferece a opção de exportar documentos como arquivos HTML para o SEI. Essa é geralmente a maneira mais confiável de obter um resultado HTML, embora o código ainda possa precisar de alguma limpeza e ajustes.

Considerações sobre a Conversão do LibreOffice para HTML:

  • A qualidade do HTML gerado pode depender da complexidade do documento original;
  • Documentos simples com formatação básica tendem a se converter melhor;
  • Imagens e tabelas podem ser incorporadas, mas o layout e a formatação podem precisar de revisão.

Converter do LibreOffice para HTML

  1. Abra o LibreOffice Writer no arquivo desejado, que pode estar em formato ODT ou DOCX;
  2. Clique em Arquivo > Salvar Como;
  3. No campo "Tipo", escolha "Documento HTML (.html, .htm)";
  4. Escolha a pasta de destino e clique em "Salvar";
  5. Caso apareça uma mensagem sobre a conversão, confirme clicando em "Sim";
  6. Salve o arquivo HTML no seu computador ou dispositivo móvel;
  7. Abra o arquivo HTML no navegador;
  8. Copie o conteúdo;
  9. Cole no editor do SEI;
  10. Revise os conteúdos para ver se tudo correu bem, especialmente as tabelas;
  11. Corrija o necessário;
  12. Ao tentar salvar o documento no editor do SEI, caso haja imagens no seu conteúdo, você receberá uma mensagem “Não são permitidas imagens referências”. Nesse caso, você precisará deletar todas as referências de imagens e inserir novamente as imagens a partir dos arquivos JPG ou PNG, seguindo os procedimentos da seção “Tratar Imagens do Documento”;
  13. Após tratar as imagens, salve o documento no editor do SEI;
  14. Salve o documento no SEI.

Do Google Docs para o SEI

O Google Docs é uma boa opção pois na UFSCar nós temos o acesso institucional às ferramentas Google, e mesmo que não tivéssemos, o Google Docs é baseado em HTML, CSS e JavaScript com alguns acréscimos. Ele usa uma combinação de tecnologias para funcionar, incluindo:

  • HTML: O HTML é usado para estruturar o conteúdo básico do documento;
  • CSS: O CSS é usado para estilizar o conteúdo, como fontes, cores e layout;
  • JavaScript: O JavaScript é usado para adicionar interatividade e funcionalidade ao documento, como edição em tempo real e colaboração;
  • Tecnologias de servidor: O Google Docs também usa tecnologias de servidor para armazenar e gerenciar documentos na nuvem.

Como o conteúdo principal do documento no GDocs é feito em HTML, tais como o texto e os estilos, ele tem uma certa compatibilidade com o Editor do SEI, desde que não seja usada uma formatação complexa que envolva imagens, integração com outras ferramentas Google, interatividade e compartilhamento.

O que acontece ao copiar e colar do Google Docs para o SEI?

Quando você copia conteúdo do Google Docs e cola no editor do SEI, o resultado pode variar dependendo do editor e da complexidade do conteúdo:

  • Conteúdo simples: Para textos simples e formatação básica, a maioria dos editores HTML exibirá o conteúdo corretamente;
  • Conteúdo complexo: Se o documento contiver formatação complexa, como tabelas, imagens ou estilos personalizados, o resultado pode não ser perfeito. Nesse caso, você precisará corrigir esses elementos no editor do SEI;
  • Formatação: A formatação pode se perder, principalmente se não for uma formatação básica.

Enfim, se você usa somente a formatação básica no GDocs, sem imagens ou tabelas complexas, o Google Docs poderá funcionar perfeitamente ao copiar o conteúdo e colar no editor do SEI.

Salvar Google Docs para HTML

Para garantir a compatibilidade, o Google Docs oferece opções para exportar documentos em diferentes formatos, incluindo HTML. Ao exportar como HTML, você obterá um arquivo que pode ser aberto em qualquer editor HTML.

Para exportar um documento do GDocs, faça o seguinte:

  1. Abra o arquivo a ser exportado e clique em Arquivo > Baixar > Página da Web (*.html, compactado);
    formatar-word-sei-exportar-gdocs-sei.jpg
  2. O documento será exportado para o formato ZIP, dentro do qual se encontra o HTML;
    formatar-word-sei-exportar-gdocs-formato-zip.jpg
  3. Descompacte o ZIP para dentro de uma pasta;
    formatar-word-sei-exportar-gdocs-descompactar-zip.jpg
  4. Clique com botão direito na pasta descompactada e selecione Abrir com > Google Chrome ou o navegador de sua preferência;
    formatar-word-sei-exportar-gdocs-clique-botao-direito.jpg
  5. Abra o documento HTML no navegador;
  6. Selecione e copie o conteúdo do Google Docs;
    formatar-word-sei-exportar-gdocs-copiar-gdocs.jpg
  7. Cole no editor do SEI;
    formatar-word-sei-exportar-gdocs-colar-no-sei.jpg
  8. Ao tentar salvar o documento no editor do SEI, caso haja imagens no seu conteúdo, você receberá uma mensagem “Não são permitidas imagens referências”. Nesse caso, você precisará deletar todas as referências de imagens e inserir novamente as imagens a partir dos arquivos JPG ou PNG, seguindo os procedimentos da seção “Tratar Imagens do Documento”;
    formatar-word-sei-exportar-gdocs-imagens-nao-permitidas.jpg
  9. Após tratar as imagens, salve o documento no editor do SEI.

Tratar imagens do documento

  1. Localize as imagens no editor do SEI e DELETE TODAS as suas referências, do contrário, não será possível salvar o documento;
    formatar-word-sei-exportar-gdocs-deletar-imagens.jpg
  2. Salve as imagens do seu conteúdo em formato JPG ou PNG;
  3. Insira as imagens individualmente nos respectivos locais do conteúdo onde devem estar.

formatar-word-sei-exportar-gdocs-inserir-imagens.jpg

Ao final das conversões de documentos HTML para o editor do SEI, faça sempre uma revisão dos estilos, tabelas e links no documento no editor do SEI, para garantir que está tudo certo!