Casa >
Neste artigo, você explorará métodos para extrair informações, como texto de imagens, Permite que você use as informações de forma eficiente para melhorar o desempenho de sua IA.
Usar a AI com tecnologia de reconhecimento de caracteres ópticos (OCR) permite que as empresas extraam informações de imagens, racionalizando assim o processo de entrada de dados, reduzindo o esforço manual e minimizando o risco de erros.
Essa abordagem facilita a conversão de informações cruciais de imagens em formato de texto, permitindo que as empresas carreguem as informações como Fontes de Conhecimento. Por conseguinte, isto contribui para aumentar a exactidão das respostas da IA, assegurando a sua actualidade.
Este artigo descreve os passos para a conversão de imagem em texto usando duas ferramentas de I.A. no mercado: Sider e ChatGPT-4. Para sua consideração, leia e descubra qual ferramenta atende às suas necessidades e ao seu orçamento de negócios.
1. Sider
Extrai texto, números e equações das imagens.
Só pode reconhecer a caligrafia em inglês.
O recurso de extração é gratuito, requer uma atualização paga para usar recursos adicionais.
Requer um processador de texto para converter o texto extraído em um arquivo PDF (para aqueles que querem usar o texto extraído como Fonte de Conhecimento).
2. Extrator de Texto ChatGPT-4
Pode reconhecer com precisão o texto em imagens.
Apenas disponível no ChatGPT-4 e requer uma melhoria paga para usar este recurso.
Pode converter diretamente o texto extraído em um arquivo PDF.
Objetivos do método
Baixe a extensão Sider no seu computador > Crie uma conta e faça o login.
Clique no ícone do sider na barra de extensão para iniciar a barra lateral > Clique no ícone OCR .
3. Envie a imagem. Certifique-se de que o tamanho do arquivo seja menor que 10MB e que a largura ou altura da imagem não seja maior que 4096 pixels.
Leia aqui para mais dicas sobre como melhorar a precisão do processo de extração.
Se a imagem carregada estiver de acordo com os requisitos, o processo de extração começará automaticamente e o resultado será exibido depois que o processo for concluído.
4. Clique em Formatação para o Sider transformar automaticamente o texto em um layout legível.
5. Para carregar o texto extraído como uma Fonte do Conhecimento, converter o texto em um arquivo PDF clicando no ícone Copiar no resultado para copiar o texto inteiro.
6. Cole o texto para um processador de texto (por exemplo, Microsoft Word ou Google Docs) e salve o arquivo como PDF.
7. Em seguida, consulte este guia para saber como fazer upload do arquivo PDF como uma Fonte de Conhecimento.
NoTexto Extratorno ChatGPT-4, clique em 📎 ícone e carregue sua imagem. Certifique-se de que o tipo de arquivo é suportado, por exemplo, JPEG, PNG, BMP, TIFF ou GIF.
Leia aqui para mais dicas sobre como melhorar a precisão do processo de extração.
2. Uma vez que a imagem é carregada, clique no ícone da seta para cima para iniciar o processo de extração.
3. Assim que o processo de extração estiver concluído, os resultados serão exibidos.
4. Para carregar o texto extraído como uma Fonte do Conhecimento, converter o texto em um arquivo PDF, fornecendo uma instrução para gerar um arquivo PDF com base no texto. O exemplo a seguir é a instrução:
Converter texto para PDF
5. Baixe o arquivo PDF gerado.
6. Em seguida, consulte este guia para saber como fazer upload do arquivo PDF como uma Fonte de Conhecimento.
A eficácia da extracção de texto depende das capacidades da ferramenta que está a ser utilizada. Para melhorar a precisão da extração de texto de imagens, você pode considerar alguns dos principais requisitos listados da seguinte forma:
Qualidade da imagem: Use imagens de alta resolução e afiadas. Evite imagens de baixa resolução ou pixeladas.
legibilidade de texto: Use imagem com texto claro e legível.
Interferência mínima em segundo plano: Use a imagem com texto sobreposto em fundos simples. Evite imagem com textos que se misturam em segundo plano ou que vêm com marca d'água.
Orientação do texto: Use imagens com texto que estão alinhados horizontalmente. Texto que são girados em um ângulo pode não produzir os melhores resultados.
Artigos relacionados 👩💻