Gå direkt till innehåll Gå direkt till meny

AI-nyheter: augusti 2025

Augusti överträffar april 2025 när det gäller tunga releaser och kontroverser och är därmed årets hittills mest händelserika AI-månad. Nyhetsbrevet riktar sig främst till utvecklare: varje avsnitt inleds med en huvudpoäng, beskriver relevansen och avslutas med praktiska teststeg där det är relevant. Längre reflektioner kring GPT-5 ligger sist för den som vill gå lite djupare.

1. OpenAI släpper två open source-modeller: gpt-oss-120b och gpt-oss-20b

Huvudpoängen: Lokal AI med bra prestanda utan att exponera känsliga data i molnet.

Nyhet: Båda modellerna är tillgängliga under Apache 2.0-licensen och presterar bra på resonemangs- och koduppgifter.

  • Hårdvarukrav:
    • 120b: ~80 GB VRAM (ex. 3×RTX 5090 eller 4×RTX 4090)
    • 20b: ~16 GB VRAM, realistiskt för konsumenter
  • Arkitektur: MoE (mixture-of-experts)

Relevans: Möjliggör on-prem/hybridlösningar.

Praktiska teststeg: Starta gpt-oss-20b via vLLM/Ollama och jämför med molnmodeller.

2. Google släpper Genie 3 – en världssimulator

Huvudpoängen: Från bild till interaktiv värld i realtid.

  • Interagera med världen, minnesfunktionalitet.
  • Flera minuter sammanhängande värld.
  • Upplösning: 720p/24 fps.

Begränsningar: Ej tillgänglig för konsumenter, fysiken bristfällig.

Signalvärde: Stort språng framåt för spel och filmer.

3. Anthropic: Claude Opus 4.1 (och Sonnet 4)

Huvudpoängen: Bättre på kodning och stabilare i stora kodbaser.

Nyhet: Sonnet 4 får upp till 1M tokens via API.

Praktiska teststeg: Kör samma repo-uppgifter i Claude och jämför.

4. GPT-5 – årets mest kontroversiella release

Huvudpoängen: Snabb när det är enkelt, tänker djupt när det behövs. Mixad mottagning.

  • Nyhet: GPT-5 tillgänglig för alla, Pro-version som premium.
  • Profiler: main, thinking, mini/nano, pro.
  • Benchmarks: AIME 94,6 %, SWE-bench 74,9 %, GPQA 88,4 %, m.fl.
  • Utvecklarperspektiv: Stark på kodanalys men svagare i mycket stora repos.

Praktiska tips: Kör gpt-5-main som standard, eskalera till gpt-5-thinking för komplexa uppgifter, använd mini/nano för batchjobb.

5. GitHub Copilot och modellval

Huvudpoängen: Välj modell beroende på uppgift, låt agenten göra förarbetet.

Nyhet: GPT-5 och Gemini 2.5 Pro tillgängliga i Copilot. Agents panel introduceras.

Praktiska teststeg: Testa samma uppgift i GPT-5 och Gemini 2.5 Pro, mät resultat.

6A. Google: Imagen 4 via Gemini API + kontext via URL

Huvudpoängen: Bild- och textsammanfattning via prompt och länkar.

Nyhet: Imagen 4 tillgänglig för alla utvecklare. URL Context gör att du kan skicka länkar direkt i prompten.

Praktiska teststeg: Skicka länkar och be om sammanställning av innehåll och bilder.

6B. Google: “Nano Banana” (Gemini 2.5 Flash Image)

Vad det är: Ett nytt läge för bildgenerering/redigering med låg latens och konsekvent identitet över flera bilder.

  • Styrkor: Identitetskonsekvens, multi-image fusion, konverserande redigering, SynthID-vattenmärkning.
  • Plattformar: Gemini-appen, AI Studio och Gemini API.
  • Begränsningar: Små ansikten, text i bilder, detaljgeometri.

Snabbguide:
Nano Banana = snabb, interaktiv redigering.
Imagen 4 = högkvalitativ rendering från grunden.

7. AWS Bedrock: AgentCore

Huvudpoängen: Agentlösningar utan egen infrastruktur.

Nyhet: Browser Tool, minne, identitet via IAM + Claude Opus 4.1.

8. NVIDIA “Physical AI”

Huvudpoängen: Uppdateringar inom simulering och robotik, Jetson Thor kör lokala AI-modeller direkt i robotar.

9. Ramverk och verktyg: PyTorch 2.8, Transformers 4.54–4.55

Huvudpoängen: Enklare installationer, snabbare och mer minnessnål LLM-körning.

10. EU-regler: AI Act och viktiga datum

Huvudpoängen: Reglerna för GPAI gäller nu. De flesta högriskkrav träder i kraft 2026–2027.

  • 2 aug 2025: skyldigheter för GPAI-modeller
  • 2 aug 2026: AI Act allmänt tillämplig
  • 2 aug 2027: sista dag för full efterlevnad

Relevans: Leverantörer inom EU måste följa nya krav. Sverige har egna riktlinjer (Digg + IMY).

11. GPT-5 bortom rubrikerna, epistemologi och reflektion

Mottagandet var spretigt från “katastrof” till “fantastiskt”. Orsaker: olika underliggande modeller, enorm användarbas, temporärt borttagna legacy-modeller. Tre avgörande axlar i produktion är kostnadseffektivitet, hallucinationsfrekvens och förmåga på stora kodbaser.

12. Sista ordet: Genie 3 – månadens mest banbrytande nyhet?

Även om OpenAI och Anthropic släppt stora uppdateringar är de mestadels inkrementella. Genie 3 flyttar gränsen från språkmodellering till fullskalig miljösimulering – vi går mot en framtid där vi inte bara pratar med modeller, vi besöker dem.

Mojgan Farmahini

Tobias Carlsson

Fler nyheter

hands with smartphonehands with smartphone

AIO vs SEO

Så optimerar du din webbplats för AI-närvaro

Abstrakt illustrationAbstrakt illustration

AI nyheter i maj 2025

Det mest relevanta som hänt inom AI senaste månaden

Mojgans AI-spaningar april 2025Mojgans AI-spaningar april 2025

Mojgans AI-spaningar, april 2025

Mojgan delar med sig av sina spaningar från AI-världen.

Ny partner – Umbraco

Decerno blir partner med Umbraco

använd gpt för ux designanvänd gpt för ux design

Så använder jag ChatGPT som UX-designer

Konkreta sätt jag använder ChatGPT i mitt dagliga UX-arbete.

Mojgans AI-spaningar, mars 2025

Mojgan bjuder på nyheter från AI-världen.

Ny kund – DB Schenker

Från idé till lösning – nytt samarbete mellan DB Schenker och Decerno.

Vem är hackern?

Välkommen på ett webinar där vi utforskar nätets undre värld, och hur vi kan skydda oss!

Webinar cybersäkerhet

Välkommen på ett webinar lett av våra specialister inom AppSec-teamet på Decerno.

AI-inspiration för ledare

AI-verktyg och resurser som kan hjälpa dig som ledare att hålla dig i framkant.

Frukostmingel IT-säkerhet

Frukostseminarium om IT-säkerhet, är ni tillräckligt skyddade?

Nätverksmingel i Malmö

Välkommen på nätverksmingel i Malmö! 18 juni kl 15:30

Frukostseminarium om AI

Decerno bjuder på AI-frukost i Göteborg den 30/5.

Low-Code webinar

Webinar – Upptäck kraften med högfartsutveckling i low-code

Responsible Business Challenge

Decerno Responsible Business Challenge är vårt program för att hjälpa er bli mer klimatsmarta

Vad är Generativ AI?

Vår guide till tekniken som senaste året revolutionerat artificiell intelligens.

Decerno på Lösningar för offentlig sektor

Low-code och hållbarhet på mässan Lösningar för offentlig sektor 2024

Partner till OutSystems

OutSystems low-code plattform blir en möjlig del av våra lösningar

Ramavtal med Kammarkollegiet

Inom området Programvaror och Tjänster, Systemutveckling.

Could not find any posts

Vill du att vi hör av oss?

Please fill out