DeepSeek-R1, der kombinerer AI og kant computing til industriel IoT

Indledning

De små størrelsesdestillerede modeller af DeepSeek-R1 er finjusteret ved hjælp af kæde-til-tanke-data genereret af DeepSeek-R1, markeret med...Mærker, der arver ræsonnementets kapaciteter. Disse finjusterede datasæt inkluderer eksplicit ræsonnementsprocesser såsom problem nedbrydning og mellemliggende fradrag. Forstærkningslæring har justeret den destillerede model's adfærdsmønstre med de ræsonnementstrin genereret af R1. Denne destillationsmekanisme giver små modeller mulighed for at opretholde beregningseffektivitet, mens de opnåede komplekse ræsonnementsevner i nærheden af ​​større modeller, hvilket er af betydelig applikationsværdi i ressourcebegrænsede scenarier. For eksempel opnår 14B-versionen 92% af kodeafslutningen af ​​den originale DeepSeek-R1-model. Denne artikel introducerer DeepSeek-R1-destilleret model og dens kerneapplikationer i industriel kant computing, opsummeret i følgende fire retninger sammen med specifikke implementeringssager:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Forudsigelig vedligeholdelse af udstyr

Teknisk implementering

Sensorfusion:

Integrer vibrationer, temperatur og aktuelle data fra PLC'er via Modbus -protokollen (prøveudtagningshastighed 1 kHz).

Funktionsekstraktion:

Kør kantimpuls på Jetson Orin NX for at udtrække 128-dimensionelle tidsseriefunktioner.

Model inferens:

Distribuer den dybseek-R1-Distill-14b-model, og indtast funktionsvektorer for at generere fejlsandsynlighedsværdier.

Dynamisk justering:

Trigger vedligeholdelsesarbejdsordrer, når tilliden> 85%, og initiér en sekundær verifikationsproces, når <60%.

Relevant sag

Schneider Electric indsatte denne løsning på minemaskineri, hvilket reducerede falske positive satser med 63% og vedligeholdelsesomkostninger med 41%.

1

Kører Deepseek R1 destilleret model på Inhand AI Edge -computere

Forbedret visuel inspektion

Output Arkitektur

Typisk implementeringsrørledning:

Kamera = GIGE_VISION_CAMERA (500fps) # Gigabit Industrial Camera
Frame = Camera.Capture () # Capture Image
forbehandlet = opencv.denoise (ramme) # denoising forarbejdning
defekt_type = dybseek_r1_7b.infer (forbehandlet) # defektklassificering
Hvis defekt_type! = 'Normal':
Plc.trigger_reject () # Trigger sorteringsmekanisme

Ydelsesmetrics

Behandlingsforsinkelse:

82 ms (Jetson Agx Orin)

Nøjagtighed:

Injektionsstøbt defektdetektion når 98,7%.

2

Deepseek R1's implikationer: Vindere og tabere i den generative AI -værdikæde

Processtrømoptimering

Nøgleteknologier

Naturlig sproginteraktion:

Operatører beskriver udstyrsanomalier via stemme (f.eks. "Ekstrudertryksvingning ± 0,3 MPa").

Multimodal ræsonnement:

Modellen genererer optimeringsforslag baseret på udstyrshistoriske data (f.eks. Justeringsskruehastighed med 2,5%).

Digital tvillingbekræftelse:

Parametersimuleringsvalidering på Edgex -støberi -platformen.

Implementeringseffekt

BASFs kemiske plante vedtog denne ordning og opnåede en 17% reduktion i energiforbruget og en stigning på 9% i produktkvalitetsraten.

3

Edge AI og fremtiden for forretning: Openai O1 vs. Deepseek R1 for sundhedsydelser, bilindustrien og IIoT

Øjeblikkelig hentning af videnbase

Arkitekturdesign

Lokal vektordatabase:

Brug CHROMADB til at gemme udstyrsvejledninger og processpecifikationer (indlejringsdimension 768).

Hybridhentning:

Kombiner BM25 -algoritme + kosinus lighed for forespørgsel.

Resultatgenerering:

R1-7B-modellen opsummerer og forbedrer indhentningsresultaterne.

Typisk sag

Siemens -ingeniører løste inverterfejl gennem naturlige sprogforespørgsler og reducerede den gennemsnitlige behandlingstid med 58%.

Implementeringsudfordringer og løsninger

Hukommelsesbegrænsninger:

Anvendte KV -cache -kvantiseringsteknologi, hvilket reducerer hukommelsesforbruget af 14B -modellen fra 32 GB til 9 GB.

Sikring af realtidsydelse:

Stabiliseret enkelt inferens latenstid til ± 15 ms gennem CUDA -grafoptimering.

Modeldrift:

Ugentlige inkrementelle opdateringer (kun transmission af 2% af parametrene).

Ekstreme miljøer:

Designet til brede temperaturområder på -40 ° C til 85 ° C med IP67 -beskyttelsesniveau.

5
微信图片 _20240614024031.jpg1

Konklusion

De aktuelle implementeringsomkostninger er nu faldet til $ 599/node (Jetson Orin NX), med skalerbare applikationer, der dannes i sektorer, såsom 3C -fremstilling, bilforsamling og energikemi. Kontinuerlig optimering af MOE -arkitektur og kvantiseringsteknologi forventes at gøre det muligt for 70B -modellen at køre på kantenheder i slutningen af ​​2025.

Find ELV -kabelløsning

Kontrolkabler

Til BMS, bus, industrielt, instrumenteringskabel.

Struktureret kablingssystem

Netværk og data, fiberoptisk kabel, patch-ledning, moduler, frontplade

2024 Exhibitions & Events Review

16. april.

16. april.-18., 2024 Securika i Moskva

9. maj 2024 Nye produkter og teknologier lanceringsbegivenhed i Shanghai

22. oktober 2024 Sikkerhed Kina i Beijing

Nov.19-20, 2024 Connected World KSA


Posttid: Feb-07-2025