Esta semana foi rica em reflexões sobre o impacto das LLMs no desenvolvimento de software, desde avaliações práticas sobre o estado atual até estratégias para torná-las mais confiáveis. Também destacamos discussões importantes sobre arquitetura resiliente e o valor dos generalistas especializados.
Coding agents have crossed a chasm
Os agentes de codificação atingiram um ponto de inflexão crucial. O autor relata como essas ferramentas passaram de curiosidades experimentais para assistentes indispensáveis no dia a dia. Claude Code e OpenAI Codex agora completam tarefas inteiras autonomamente, mudando fundamentalmente o fluxo de trabalho - desde a criação de ferramentas pessoais até correção de bugs complexos em produção.
Software engineering with LLMs in 2025: temperature check
Gergely Orosz apresenta os resultados de sua pesquisa anual sobre o uso de IA no desenvolvimento. Conversou com engenheiros em startups de IA (Anthropic, Cursor), Big Tech (Google, Amazon) e desenvolvedores independentes como Kent Beck e Simon Willison. O consenso: as ferramentas estão se espalhando rapidamente, mas ainda estamos descobrindo exatamente como elas transformarão a engenharia de software.
From idea to PR: A guide to GitHub Copilot's agentic workflows
GitHub detalha como o Copilot evoluiu para workflows autônomos completos - da ideia inicial até o pull request pronto. O artigo demonstra na prática como usar o Copilot Workspace para transformar uma issue em código funcional, incluindo planejamento, implementação e testes, representando uma mudança fundamental de assistente para agente autônomo.
Reliability for unreliable LLMs
Stack Overflow explora como adicionar determinismo a sistemas baseados em LLMs não-determinísticos. O artigo cobre técnicas essenciais: sanitização de inputs/outputs (filtrando jailbreaks, PII e conteúdo tóxico), observabilidade aprimorada (logging detalhado de prompts e respostas), uso de "LLM-as-judge" para validação, e orquestração determinística de workflows. Inclui insights de líderes como IBM, Salesforce e Vectara.
Tool Calling with Local LLMs: A Practical Evaluation
Docker avalia sistematicamente o desempenho de LLMs locais para tool calling, testando modelos como Llama, Qwen e Mistral. Os resultados mostram que modelos menores otimizados (como Qwen 2.5 de 7B parâmetros) podem igualar ou superar modelos maiores em tarefas específicas. Crucial para empresas que precisam de soluções on-premise por questões de privacidade, custos ou latência. O artigo inclui benchmarks detalhados e código reproduzível.
The principles of extreme fault tolerance
PlanetScale compartilha os princípios e processos que garantem sua confiabilidade extrema: isolamento (partes independentes física e logicamente), redundância (múltiplas cópias isoladas) e estabilidade estática (continuar operando com último estado válido). O artigo detalha como esses princípios se traduzem em arquitetura e processos operacionais, incluindo failovers semanais em todos os bancos de clientes.
Tools: Code Is All You Need
Armin Ronacher (criador do Flask) questiona o hype em torno do MCP (Model Context Protocol) e defende que código simples e bem estruturado é mais eficaz. Ele demonstra como transformou todo seu blog de reStructuredText para Markdown usando LLMs para gerar scripts Python reutilizáveis, em vez de depender de integrações complexas. A mensagem: automatize com código que você pode entender, depurar e executar 100 vezes.
Why Organizations Need Expert Generalists
Martin Fowler defende o valor dos "generalistas especializados" - profissionais em forma de T com profundidade em várias áreas e amplitude em muitas outras. O artigo enfatiza que esses profissionais focam em domínios duradouros (sistemas distribuídos, arquitetura cloud-native) em vez de ferramentas específicas. São essenciais para conectar silos organizacionais, traduzir entre equipes técnicas e de negócios, e liderar transformações complexas.
🎥 Talks e Apresentações
AI-Driven Code Refactoring: Improving Legacy Codebases Automatically - Jorrik Klijnsma
02 Jul 2025 ⸱ 59m
Kotlin Clean Architecture for Serverless: Business Logic You Can Take Anywhere | Elena van Engelen
02 Jul 2025 ⸱ 33m 44s
Resilient by Design - Chris Ayers - NDC Oslo 2025
04 Jul 2025 ⸱ 54m 21s
Claude Code & the evolution of agentic coding — Boris Cherny, Anthropic
04 Jul 2025 ⸱ 18m 12s
📰 Receba mais conteúdo como este
Inscreva-se na newsletter para receber links, insights e análises sobre engenharia de software, arquitetura e liderança técnica diretamente no seu e-mail.
Tidak ada komentar:
Posting Komentar