DeepSeek-R1 kombinerer AI og Edge Computing til industriel IoT

Indledning

De små destillerede modeller af DeepSeek-R1 er finjusteret ved hjælp af tankekædedata genereret af DeepSeek-R1, markeret med...tags, der arver R1's ræsonnementsevner. Disse finjusterede datasæt inkluderer eksplicit ræsonnementsprocesser såsom problemdekomposition og mellemliggende deduktioner. Forstærkningslæring har justeret den destillerede models adfærdsmønstre med de ræsonnementstrin, der genereres af R1. Denne destillationsmekanisme gør det muligt for små modeller at opretholde beregningseffektivitet, samtidig med at de opnår komplekse ræsonnementsevner, der er tæt på større modellers, hvilket er af betydelig anvendelsesværdi i ressourcebegrænsede scenarier. For eksempel opnår 14B-versionen 92% af kodefuldførelsen i den originale DeepSeek-R1-model. Denne artikel introducerer den destillerede DeepSeek-R1-model og dens kerneapplikationer inden for industriel edge computing, opsummeret i de følgende fire retninger sammen med specifikke implementeringssager:

dc3c637c5bead8b62ed51b6d83ac0b4

Prædiktiv vedligeholdelse af udstyr

Teknisk implementering

Sensorfusion:

Integrer vibrations-, temperatur- og strømdata fra PLC'er via Modbus-protokollen (samplinghastighed 1 kHz).

Funktionsudtrækning:

Kør Edge Impulse på Jetson Orin NX for at udtrække 128-dimensionelle tidsseriefunktioner.

Modelinferens:

Implementer DeepSeek-R1-Distill-14B-modellen, og indtast funktionsvektorer for at generere sandsynlighedsværdier for fejl.

Dynamisk justering:

Udløs vedligeholdelsesordrer, når konfidensen er > 85 %, og start en sekundær verifikationsproces, når den er < 60 %.

Relevant sag

Schneider Electric implementerede denne løsning på minedriftsmaskiner, hvilket reducerede falsk positive tal med 63 % og vedligeholdelsesomkostninger med 41 %.

1

Kørsel af DeepSeek R1 Distilled Model på InHand AI Edge-computere

Forbedret visuel inspektion

Outputarkitektur

Typisk implementeringspipeline:

kamera = GigE_Vision_Camera(500fps) # Gigabit industrikamera
frame = camera.capture() # Tag billede
preprocessed = OpenCV.denoise(frame) # Støjfjerning af forbehandling
defect_type = DeepSeek_R1_7B.infer(forbehandlet) # Fejlklassificering
hvis defekttype != 'normal':
PLC.trigger_reject() # Trigger sorteringsmekanisme

Ydelsesmålinger

Behandlingsforsinkelse:

82 ms (Jetson AGX Orin)

Nøjagtighed:

Detektion af defekter ved sprøjtestøbning når 98,7%.

2

DeepSeek R1's implikationer: Vindere og tabere i den generative AI-værdikæde

Optimering af procesflow

Nøgleteknologier

Naturlig sproglig interaktion:

Operatører beskriver udstyrsforstyrrelser via stemme (f.eks. "Ekstrudertryksudsving ±0,3 MPa").

Multimodal ræsonnement:

Modellen genererer optimeringsforslag baseret på udstyrets historiske data (f.eks. justering af skruehastigheden med 2,5%).

Digital tvillingbekræftelse:

Parametersimuleringsvalidering på EdgeX Foundry-platformen.

Implementeringseffekt

BASFs kemiske fabrik implementerede denne ordning og opnåede en reduktion på 17 % i energiforbruget og en stigning på 9 % i produktkvaliteten.

3

Edge AI og fremtidens erhvervsliv: OpenAI o1 vs. DeepSeek R1 til sundhedsvæsenet, bilindustrien og IIoT

Øjeblikkelig hentning af vidensbase

Arkitekturdesign

Lokal vektordatabase:

Brug ChromaDB til at gemme udstyrsmanualer og processpecifikationer (indlejring af dimension 768).

Hybrid hentning:

Kombiner BM25-algoritmen + cosinus-ligheden til forespørgslen.

Resultatgenerering:

R1-7B-modellen opsummerer og forfiner hentningsresultater.

Typisk tilfælde

Siemens' ingeniører løste inverterfejl via forespørgsler i naturligt sprog, hvilket reducerede den gennemsnitlige behandlingstid med 58 %.

Udfordringer og løsninger ved implementering

Hukommelsesbegrænsninger:

Anvendte KV Cache-kvantiseringsteknologi, hvilket reducerede hukommelsesforbruget for 14B-modellen fra 32 GB til 9 GB.

Sikring af ydeevne i realtid:

Stabiliseret enkeltinferensforsinkelse til ±15 ms gennem CUDA Graph-optimering.

Modeldrift:

Ugentlige trinvise opdateringer (transmitterer kun 2% af parametrene).

Ekstreme miljøer:

Designet til brede temperaturområder fra -40°C til 85°C med IP67-beskyttelsesniveau.

5
微信图片_20240614024031.jpg1

Konklusion

De nuværende implementeringsomkostninger er nu faldet til $599/node (Jetson Orin NX), med skalerbare applikationer under udvikling i sektorer som 3C-produktion, bilmontering og energikemi. Løbende optimering af MoE-arkitekturen og kvantiseringsteknologien forventes at gøre det muligt for 70B-modellen at køre på edge-enheder inden udgangen af ​​2025.

Find ELV-kabelløsning

Styrekabler

Til BMS, BUS, industri og instrumentkabel.

Struktureret kabelsystem

Netværk og data, fiberoptisk kabel, patchkabel, moduler, frontplade

Gennemgang af udstillinger og begivenheder i 2024

16.-18. april 2024 Mellemøsten-Energi i Dubai

16.-18. april 2024 Securika i Moskva

9. maj 2024 LANCERING AF NYE PRODUKTER OG TEKNOLOGIER i Shanghai

22.-25. oktober 2024 SECURITY CHINA i Beijing

19.-20. november 2024 CONNECTED WORLD KSA


Opslagstidspunkt: 7. februar 2025