Deepseek-r1 combinando la computación de IA y Edge para IoT industrial

Introducción

Los modelos destilados de tamaño pequeño de Deepseek-R1 están ajustados utilizando datos de cadena de pensamiento generados por Deepseek-R1, marcados con...Etiquetas, heredando las capacidades de razonamiento de R1. Estos conjuntos de datos ajustados incluyen explícitamente procesos de razonamiento, como la descomposición del problema y las deducciones intermedias. El aprendizaje de refuerzo ha alineado los patrones de comportamiento del modelo destilado con los pasos de razonamiento generados por R1. Este mecanismo de destilación permite que los modelos pequeños mantengan la eficiencia computacional al tiempo que obtienen habilidades de razonamiento complejas cerca de las de modelos más grandes, lo cual tiene un valor de aplicación significativo en escenarios limitados por recursos. Por ejemplo, la versión 14B logra el 92% de la finalización del código del modelo original Deepseek-R1. Este artículo presenta el modelo destilado Deepseek-R1 y sus aplicaciones centrales en la informática de los borde industrial, resumido en las siguientes cuatro direcciones, junto con casos de implementación específicos:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Mantenimiento predictivo de equipos

Implementación técnica

Fusión del sensor:

Integre los datos de vibración, temperatura y corriente de los PLC a través del protocolo Modbus (velocidad de muestreo 1 kHz).

Extracción de características:

Ejecute el impulso de borde en Jetson Orin NX para extraer características de series de tiempo 128 dimensionales.

Inferencia del modelo:

Implemente el modelo Deepseek-R1-Distill-14b, ingresando vectores de características para generar valores de probabilidad de fallas.

Ajuste dinámico:

Activar órdenes de trabajo de mantenimiento cuando la confianza> 85%, e inicie un proceso de verificación secundario cuando <60%.

Caso relevante

Schneider Electric desplegó esta solución en maquinaria minera, reduciendo las tasas falsas positivas en un 63% y los costos de mantenimiento en un 41%.

1

Ejecutando el modelo destilado R1 de Deepseek R1 en las computadoras de INHand Ai Edge

Inspección visual mejorada

Arquitectura de salida

Tubería de implementación típica:

cámara = gige_vision_camera (500fps) # Gigabit Industrial Camera
frame = cámaras. Capture () # Capture Image
preprocesado = opencv.denoise (marco) # preprocesamiento de denoising
Defect_type = Deepseek_r1_7b.infer (preprocesado) # Clasificación de defectos
if defect_type! = 'normal':
Plc.trigger_reject () # mecanismo de clasificación de activación

Métricas de rendimiento

Retraso de procesamiento:

82 MS (Jetson Agx Orin)

Exactitud:

La detección de defectos moldeados por inyección alcanza el 98.7%.

2

Implicaciones de Deepseek R1: ganadores y perdedores en la cadena de valor de IA generativa

Optimización del flujo de procesos

Tecnologías clave

Interacción del lenguaje natural:

Los operadores describen anomalías de equipos a través de la voz (por ejemplo, "fluctuación de presión extrusora ± 0.3 MPa").

Razonamiento multimodal:

El modelo genera sugerencias de optimización basadas en datos históricos del equipo (por ejemplo, ajustar la velocidad del tornillo en un 2.5%).

Verificación gemela digital:

Validación de simulación de parámetros en la plataforma Foundry EdgeX.

Efecto de implementación

La planta química de BASF adoptó este esquema, logrando una reducción del 17% en el consumo de energía y un aumento del 9% en la tasa de calidad del producto.

3

Edge AI y el futuro de los negocios: OpenAi O1 vs. Deepseek R1 para la atención médica, automotriz e iiot

Recuperación instantánea de la base de conocimiento

Diseño de arquitectura

Base de datos de vector local:

Use ChromAdB para almacenar manuales de equipos y especificaciones de procesos (incrustación de dimensión 768).

Recuperación híbrida:

Combine el algoritmo BM25 + similitud de coseno para la consulta.

Generación de resultados:

El modelo R1-7B resume y refina los resultados de la recuperación.

Caso típico

Los ingenieros de Siemens resolvieron fallas de los inversores a través de consultas de lenguaje natural, reduciendo el tiempo de procesamiento promedio en un 58%.

Desafíos y soluciones de implementación

Limitaciones de memoria:

Utilizó la tecnología de cuantización de caché KV, reduciendo el uso de memoria del modelo 14B de 32 GB a 9GB.

Asegurar el rendimiento en tiempo real:

Latencia de inferencia única estabilizada a ± 15 ms a través de la optimización del gráfico CUDA.

Modelo Drift:

Actualizaciones incrementales semanales (transmitiendo solo el 2% de los parámetros).

Entornos extremos:

Diseñado para amplios rangos de temperatura de -40 ° C a 85 ° C con nivel de protección IP67.

5
微信图片 _20240614024031.jpg1

Conclusión

Los costos de implementación actuales ahora han disminuido a $ 599/nodo (Jetson Orin NX), con aplicaciones escalables que se forman en sectores como la fabricación 3C, el ensamblaje automotriz y la química energética. Se espera que la optimización continua de la tecnología de arquitectura y cuantización del MOE permita que el modelo 70B ejecute dispositivos de borde a fines de 2025.

Encuentra la solución de cable de Elv

Cables de control

Para BMS, bus, industrial, cable de instrumentación.

Sistema de cableado estructurado

Red y datos, cable de fibra óptica, cable de parche, módulos, placa frontal

Revisión de 2024 exposiciones y eventos

De 18 de abril al 18, 2024 Middle-East-Energy en Dubai

De 16 de abril al 18, 2024 Securika en Moscú

9 de mayo, 2024 Evento de lanzamiento de New Products & Technologies en Shanghai

Oct.22 ° 25, 2024 Seguridad China en Beijing

19 de noviembre.


Tiempo de publicación: febrero-07-2025