Trabalho Aprendizado de Máquina - Pós IA e Data Analisys - Wagner Pereira
Source: Dev.to
O Que Eu Fiz e Por Quê
Neste trabalho eu exercitei a criação de um processo de reconhecimento de imagens usando duas abordagens diferentes de inteligência artificial (IA) conforme solicitado:
- Teachable Machine – IA que aprende a partir dos meus exemplos.
- AI Studio (Google) – IA que responde a comandos de texto (prompt).
Como bônus, criei uma aplicação no AI Studio para simular o comportamento do Teachable Machine, comparar as diferenças e aprender com elas.
Objetos escolhidos para o treinamento:
- STEVE
- TUX
- REMOTE
- WATCH
Lab IA Preditiva
Teachable Machine
Como Foi Fácil De Usar
O Teachable Machine mostrou-se muito simples de usar, desde a montagem do dataset até o teste de reconhecimento usando a webcam.
Tirei várias fotos de cada objeto, mostrando ângulos diferentes:
| Objeto | Nº de fotos |
|---|---|
| STEVE | 5 |
| TUX | 6 |
| REMOTE | 5 |
| WATCH | 6 |
A Hora Que Ele Aprendeu
Depois de enviar as fotos, cliquei em “Train” e o modelo começou a aprender. Testei usando a webcam:
Testes bem‑sucedidos
- STEVE → “STEVE” – 99 %
- TUX → “TUX” – 100 %
- REMOTE → “REMOTE” – 99 %
- WATCH → “WATCH” – 99 %
Teste em que ele se confundiu
- AirPods → o modelo apontou entre REMOTE e WATCH.
Resumo
A ferramenta é interessante e evidencia a importância de um dataset robusto: quanto mais exemplos de qualidade, maior a confiança (percentual) nas previsões.
Para o AI Studio, o modelo já vem pré‑treinado com milhões de imagens; o que realmente determina o sucesso é a qualidade do prompt (pedido) que orienta a IA a responder apenas o nome do objeto.
Prompt Utilizado no AI Studio
Você é uma especialista em reconhecimento de imagens. Seu objetivo é identificar objetos específicos com base em um conjunto de dados previamente treinado.
Regras de Resposta:
Para cada imagem enviada, você deve retornar somente e exclusivamente o nome do objeto em letras maiúsculas.
Não utilize saudações, explicações, pontuações adicionais ou artigos.
Restrição Estrita: Se o objeto na imagem não for um dos quatro objetos aprendidos listados abaixo, você deve retornar exatamente a frase: Objeto não aprendido.
Objetos Aprendidos (Base de Conhecimento):
STEVE: Miniatura/boneco do Steve Jobs (vestindo camiseta preta, calça jeans azul e tênis cinza, com barba grisalha).
TUX: Miniatura de pinguim azul (mascote do Linux), textura de impressão 3D.
REMOTE: Controle remoto branco de ar‑condicionado da marca Panasonic (modelo Inverter).
WATCH: Relógio inteligente (Apple Watch Ultra) com corpo prateado e pulseira de borracha azul marinho ondulada.
Código (AI Studio)
# Exemplo de chamada à API do AI Studio (pseudocódigo)
import aistudio
prompt = """"""
image_path = "caminho/para/imagem.jpg"
response = aistudio.generate(prompt=prompt, image=image_path)
print(response) # Deve imprimir apenas o nome do objeto ou "Objeto não aprendido"
Testes no AI Studio
- Teste bem‑sucedido: foto de STEVE → resposta “STEVE”.
- Teste com resposta longa: foto de AirPods → a IA descreveu o objeto em vez de usar a resposta curta esperada.
Comparação entre Teachable Machine e AI Studio
| Aspecto | Teachable Machine | AI Studio (Google) |
|---|---|---|
| Facilidade de uso | Muito simples; basta arrastar fotos e treinar. | Requer criação de prompt preciso. |
| Velocidade de resultados | Treinamento rápido; respostas imediatas via webcam. | Respostas dependem da qualidade do prompt. |
| Precisão | Alta quando há muitas fotos variadas. | Alta quando o prompt está bem formulado. |
| Flexibilidade | Limitado a imagens fornecidas. | Pode usar conhecimento pré‑treinado da Google. |
| Erros comuns | Confusão entre objetos visualmente semelhantes. | Respostas verbosas ou fora do formato esperado. |
Qual foi melhor para a tarefa de “dizer apenas o nome do objeto”?
Para esta tarefa específica, o Teachable Machine foi mais direto e rápido, pois entregou o nome do objeto com alta acurácia sem necessidade de ajustes de prompt. No entanto, o AI Studio pode ser mais preciso se o prompt for cuidadosamente elaborado.
Segredos de cada abordagem
- Teachable Machine: coletar muitas fotos de diferentes ângulos.
- AI Studio: escrever um prompt muito claro e restritivo.
Se o objetivo fosse apenas ter um “entendedor de imagens” simples, eu escolheria o Teachable Machine por ser mais fácil de usar e entregar respostas corretas de forma consistente.
Conclusão
Aprendi que existem diferentes maneiras de fazer a IA trabalhar:
- Teachable Machine – fornece exemplos diretos e aprende a partir deles.
- AI Studio – requer prompts bem formulados para guiar um modelo já pré‑treinado.
Ambas as abordagens foram valiosas para entender na prática como a inteligência artificial pode ser aplicada ao reconhecimento de imagens.
Links úteis
- Teachable Machine:
- AI Studio (Google):