banner

Noticias

Feb 16, 2024

Comparación de modelos de aprendizaje para predecir concentraciones de LDPE, PET y ABS en sedimentos de playas en función de la reflectancia espectral

Scientific Reports volumen 13, número de artículo: 6258 (2023) Citar este artículo

532 Accesos

1 altmétrica

Detalles de métricas

Se ha estimado que la contaminación por microplásticos (MP) en la tierra es 32 veces mayor que en los océanos y, sin embargo, existe una clara falta de investigación sobre los MP del suelo en comparación con los MP marinos. Las playas son puentes entre la tierra y el océano y presentan lugares igualmente poco estudiados de contaminación por microplásticos. El infrarrojo cercano visible (vis-NIR) se ha aplicado con éxito para medir la reflectancia y predecir las concentraciones de polietileno de baja densidad (LDPE), tereftalato de polietileno (PET) y cloruro de polivinilo (PVC) en el suelo. La rapidez y precisión asociadas con este método hacen que vis-NIR sea prometedor. El presente estudio explora enfoques de aprendizaje automático y regresión PCA para desarrollar modelos de aprendizaje. Primero, utilizando un espectrorradiómetro, se midieron los datos de reflectancia espectral a partir de sedimentos de playa tratados enriquecidos con gránulos de microplástico vírgenes [LDPE, PET y acrilonitrilo butadieno estireno (ABS)]. Utilizando los datos espectrales registrados, se desarrollaron modelos predictivos para cada microplástico utilizando ambos enfoques. Ambos enfoques generaron modelos de buena precisión con valores de R2 superiores a 0,7, valores de error cuadrático medio (RMSE) inferiores a 3 y error medio absoluto (MAE) <2,2. Por lo tanto, utilizando el método de este estudio, es posible desarrollar rápidamente modelos predictivos precisos sin la necesidad de una preparación integral de la muestra, utilizando la opción de bajo costo ASD HandHeld 2 VNIR Spectroradiometer.

Los plásticos son populares debido a su durabilidad, propiedades maleables y bajo costo de fabricación1. Sin embargo, su uso excesivo y métodos inadecuados de eliminación han provocado una grave contaminación plástica en el medio ambiente2,3,4. Los plásticos que terminan en el medio ambiente pueden luego, a través de factores ambientales químicos, físicos o biológicos, descomponerse en fragmentos más pequeños conocidos como microplásticos (MP). Varios estudios informaron de un gran número de MP en el medio marino5,6,7. Los MP pueden servir como transporte de sustancias químicas tóxicas, así como hábitat para microorganismos dañinos8. Afectan y amenazan la composición microbiana, la salud de los ecosistemas y las cadenas alimentarias9,10.

Sin embargo, la mayor parte de los residuos plásticos del medio marino proceden del uso de plásticos en el interior11. En consecuencia, se estima que la contaminación por microplásticos en la tierra es 32 veces mayor que en los océanos12. Las fuentes de contaminación plástica en el suelo incluyen lodos de depuradora que contienen microplásticos primarios (microperlas), fertilizantes y productos de cuidado personal12,13. Otras fuentes incluyen los vertederos y el riego con aguas residuales14,15. Además, una gran cantidad de polietileno de baja densidad (LDPE) se utiliza para la agricultura y para la aplicación de mantillo16. Es importante destacar que estos MP entran en contacto con las superficies del suelo de estas fuentes y luego se filtran al subsuelo, ingresando así al ambiente del suelo6. Con el tiempo se degradan en trozos más pequeños y se filtran al agua subterránea que se utiliza para beber17. Los aditivos de los plásticos pueden filtrarse, lo que puede ser perjudicial para la biota del suelo7. Además, debido a la superficie hidrofóbica de los plásticos, estos absorben otros tóxicos como pesticidas organoclorados, metales y bifenilos policlorados (PCB)3. Por último, además de absorber tóxicos, las superficies de los MP del suelo pueden albergar patógenos microbianos que contienen genes de resistencia a los antibióticos, lo que puede aumentar la propagación de enfermedades microbianas resistentes a los antibióticos18.

A pesar de que la mayoría de los MP se encuentran potencialmente en el suelo, todavía hay una clara falta de investigación sobre los MP del suelo en comparación con los MP marinos18. Hay incluso menos investigaciones sobre el seguimiento de los MP del suelo19. Es bien reconocida la necesidad de desarrollar métodos estandarizados para cuantificar MP en el suelo19,20,21. La gran mayoría de los estudios utilizaron espectroscopía Raman, infrarrojo transformado de Fourier (FTIR) y pirólisis-cromatografía de gases-espectrometría de masas (Pyr-GC-MS) para cuantificar los MP18,22. Todos estos métodos requieren mucho tiempo ya que las muestras deben pasar por una separación por densidad para separar los MP23.

El uso de espectroscopía de infrarrojo cercano visible (vis-NIR) para identificar y cuantificar MP se ha explorado menos, pero se ha utilizado con éxito para medir la reflectancia y predecir la concentración de MP en el suelo20,23. Manley demostró que las moléculas que contienen enlaces químicos X-H, es decir, O-H, C-H, dan un perfil espectral mensurable en el espectro vis-NIR24. Por lo tanto, a través de la espectroscopia vis-NIR, la visualización espectral, el establecimiento de relaciones entre los valores de absorción en longitudes de onda específicas y el modelo de regresión apropiado, se puede predecir y medir la cantidad de MP. Mediante la espectroscopía vis-NIR también es posible realizar análisis cualitativos (clasificación de plásticos), ya que las diferencias en las propiedades físicas se reflejan en los espectros.

El potencial de la detección y cuantificación de microplásticos basada en el aprendizaje automático a través de visión por computadora y espectroscopia FTIR se ha explorado en ecosistemas acuáticos25,26,27,28, pero solo existen unos pocos estudios seleccionados sobre la combinación de datos de espectroscopia vis-NIR y análisis de máquinas. aprendizaje de técnicas para la detección de microplásticos en el suelo20,23.

En este estudio, se recogieron y trataron sedimentos de playa para obtener una muestra de sedimento tratado. Las partículas de suelo en el sedimento se estandarizaron al mismo tamaño tamizándolas a través de un tamiz metálico, seguido de una separación de densidad repetida para eliminar cualquier MP e impurezas en el sedimento. Luego se le agregaron concentraciones crecientes de microgránulos de polietileno virgen de baja densidad (LDPE), tereftalato de polietileno (PET) y acrilonitrilo butadieno estireno (ABS). La reflectancia del sedimento enriquecido se registró mediante espectroscopia vis-NIR (325–1075 nm) y se desarrollaron y validaron modelos predictivos de regresión PCA y de regresión lineal de aprendizaje automático.

El experimento consta de 4 pasos. La Figura 1 muestra una visión general del enfoque metodológico de este estudio. Se trató el sedimento de la playa de arena y se le agregaron concentraciones variables de MP de LDPE, PET y ABS. La reflectancia del sedimento enriquecido se registró mediante espectroscopia vis-NIR, se desarrollaron modelos de aprendizaje utilizando enfoques de regresión PCA y regresión lineal de aprendizaje automático (Fig. 2).

Resumen del enfoque metodológico para desarrollar los modelos predictivos. El diagrama de flujo se divide en dos secciones: modelo de regresión de aprendizaje automático y modelo de regresión polinómica.

La reflectancia promedio (RU) de ABS (cuadrado), sedimento de playa tratado (diamante), LDPE (círculo) y PET (triángulo) frente a la longitud de onda (en nm) en todas las concentraciones en el sedimento de playa tratado. En la figura también se muestra la reflectancia promedio (RU) del sedimento de playa tratado sin ningún microplástico.

Se recogieron sedimentos de playa de arena de Damai Beach, Sarawak (1° 45′05.5″ N 110° 18′50.0″ E). Se usó una cuchara de metal estéril para recolectar la capa superior de 5 cm de sedimento de la playa y se transfirió a un vaso de precipitados de vidrio estéril de 1 L. La boca del vaso de vidrio se cubrió firmemente con papel de aluminio para evitar la contaminación del medio ambiente durante el transporte al laboratorio. La eliminación de MP y la preparación de la muestra de sedimento de la playa fueron adaptadas de He et al.11. El sedimento de la playa se tamizó utilizando un tamiz metálico con un tamaño de malla de 1 mm para eliminar conchas, hojas y otras sustancias orgánicas de gran tamaño. Se transfirieron 400 g de sedimento de playa tamizado a un nuevo vaso de precipitados de vidrio de 1 litro y se llevó a cabo la separación por densidad (se agregaron 400 ml de solución saturada de NaCl 8,56 molar, HiMedia, Alemania al vaso de precipitados que contenía el sedimento de playa tamizado). La mezcla se agitó durante 10 minutos usando una cuchara de metal grande y se dejó durante la noche, después de lo cual la suspensión se decantó cuidadosamente. La separación por densidad y la decantación se repitieron dos veces para garantizar que se eliminaran todas las impurezas del sedimento de la playa. Para eliminar el exceso de NaCl después de la separación por densidad, el sedimento se vertió en un tamiz metálico de 63 µm y se dejó pasar 1 litro de Milli-Q a través del sedimento en el tamiz metálico. Luego, el sedimento se transfirió a un vaso de vidrio y se dejó secar en un horno a 40 °C durante 6 h para obtener una muestra de sedimento de playa tratado.

Se transfirieron 20 g del sedimento de playa purificado a un cristal de reloj y se le agregaron microgránulos de LDPE o ABS o PET virgen en incrementos secuenciales de 0,1% p/p. Los gránulos de microplástico se obtuvieron del Fraunhofer-Institute Karlsruhe, Alemania, y tenían un tamaño inferior a 5 mm29. Se utilizó el espectrorradiómetro ASD HandHeld 2 VNIR (Malvern Panalytical, Worcestershire, Reino Unido) para registrar las reflectancias en el rango de longitud de onda vis-NIR de 325 a 1075 nm. Para cada concentración (que oscila entre 0,1 y 15 % p/p), la reflectancia se registró utilizando la sonda de contacto en cinco ubicaciones diferentes, trabajando en el sentido de las agujas del reloj desde el borde exterior de la muestra hasta el centro de la muestra. Luego se utilizó el promedio de las 5 lecturas para análisis posteriores. Se crearon conjuntos de datos separados para cada tipo de MP, donde cada MP tenía 46 muestras con concentraciones variables (0,1 a 15% p/p), lo que da un total de 138 muestras estudiadas. Cada conjunto de datos MP tenía 230 lecturas espectrales en lugar de 46 lecturas, ya que para cada concentración había 5 lecturas.

Después de tomar el promedio de 5 lecturas para cada concentración, los conjuntos de datos de cada MP se normalizaron utilizando la función de programación R integrada escala(). La función utiliza la siguiente fórmula.

donde \(x\) es el valor de reflectancia de cada longitud de onda, \(\mu\) es la reflectancia media de la longitud de onda y \(\sigma\) es la desviación estándar de la reflectancia de la longitud de onda.

Después de la normalización de los conjuntos de datos, se construyeron modelos predictivos para los tres conjuntos de datos de MP en sedimentos de playas mediante un enfoque de regresión PCA y un enfoque de aprendizaje automático. Se utilizó la programación R para el enfoque de regresión PCA, mientras que Scikit-Learn se utilizó el enfoque de aprendizaje automático.

Para el enfoque de regresión PCA, se utilizaron los paquetes FactoMineR y factoextra en programación R para encontrar las 15 longitudes de onda más significativas para cada conjunto de datos MP a través de PCA. Luego, estas 15 longitudes de onda significativas se dividieron aleatoriamente en conjuntos de datos de entrenamiento y prueba 70/30 y luego se validaron de forma cruzada. El valor R cuadrado (R2), el error cuadrático medio (RMSE) y el error absoluto medio (MAE) se utilizaron como métricas de rendimiento de los modelos.

Para el aprendizaje automático, se implementó la biblioteca de software Scikit-Learn para identificar y seleccionar las características más significativas (es decir, longitudes de onda) para cada microplástico respectivo utilizando el algoritmo de importancia de características y el algoritmo de regreso aleatorio disponibles en la biblioteca Scikit-Learn30. La importancia de la característica actúa como un indicador de cada contribución individual de cada característica correspondiente en un clasificador particular31. Desde el proceso de selección del algoritmo de regresión, se utilizó el regresor de bosque aleatorio (RF) para LDPE, mientras que el regresor K-vecino más cercano (KNN) se utilizó para PET y ABS en el desarrollo de los modelos de regresión. Se generaron las mismas métricas (R2, RMSE, MAE) a través de este enfoque para evaluar el rendimiento de los modelos.

Luego se compararon las métricas de desempeño generadas por ambos enfoques.

Las siguientes ecuaciones. (1), (2) y (2) representan las ecuaciones R2, RMSE y MAE respectivamente:

donde SSEw = suma ponderada de cuadrados, W = peso total de la población.

donde MAE = error absoluto medio, yi = predicción, xi = valor verdadero, n = número total de puntos de datos.

Este enfoque, como se mencionó anteriormente, utilizó los paquetes FactoMineR y factoextra en programación R para encontrar las 15 longitudes de onda más significativas para cada conjunto de datos MP a través de PCA. Para el conjunto de datos LDPE, la matriz de correlación se calculó mediante la función cor(). Luego, la PCA se realizó utilizando la función princomp(). La función resumen() en R muestra los resultados de PCA, con la columna titulada "Proporción acumulativa" observada para la importancia de cada componente principal. Para visualizar esto, se utilizó la función fviz_eig(), que muestra el diagrama de pedregal. Utilizando el diagrama de pedregal (Figura complementaria S3), se determinó cuántos componentes se necesitaban para explicar al menos el 80% de la varianza total en el conjunto de datos. La función fviz_cos2() se usó para mostrar cuánto contribuye cada longitud de onda a los componentes seleccionados (los argumentos para 'elección' se establecieron en var, para 'ejes' fue 1:2 y 'superior' fue 15). Una vez determinadas las 15 longitudes de onda principales, se dividieron aleatoriamente en conjuntos de datos de entrenamiento y prueba 70/30. El conjunto de datos de entrenamiento se ajustó a un modelo de regresión utilizando la función R incorporada lm(). La fórmula para el modelo de regresión fue la siguiente: –

donde la variable de respuesta y es la concentración (w/w), \({x}_{n}\) la variable predictora son las longitudes de onda del conjunto de datos de entrenamiento, \({\beta }_{0}\) es la intersección y \({\beta }_{n}\) es el coeficiente de regresión.

Después de ajustar el modelo utilizando el conjunto de datos de entrenamiento, se observaron los gráficos de diagnóstico del modelo (creados usando la función plot()) para la distribución de los términos residuales (Figura complementaria S5). El conjunto de datos de prueba se aplicó al modelo entrenado utilizando la función predict() en la programación R. El valor R cuadrado (R2), el error cuadrático medio (RMSE) y el error absoluto medio (MAE) se utilizaron como métricas de rendimiento del modelo entrenado. Los pasos anteriores se repitieron para los conjuntos de datos PET y ABS.

Primero, se utilizó la función de importancia de características y el algoritmo de regresor aleatorio de la biblioteca Scikit-Learn para seleccionar quince características (longitudes de onda) de las lecturas vis-NIR de los datos de LDPE, PET y ABS. Las características seleccionadas y sus puntuaciones de importancia se proporcionan en las figuras 3a a c. Los datos de reflectancia de la longitud de onda con la puntuación más alta de la función de importancia de la característica se dividieron en un 70 % para los datos de entrenamiento y un 30 % para los datos de prueba. A continuación, se creó una serie de algoritmos de regresión con configuraciones de hiperparámetros predeterminadas de la biblioteca Scikit-Learn. Los algoritmos de regresión incluidos en el proceso se incluyen en la Tabla complementaria S2. Los datos de entrenamiento de las muestras de microplásticos se iteraron en la tubería y se devolvió el modelo de regresión con el error cuadrático medio (MSE) más bajo calculado mediante validación cruzada. Los detalles sobre el MSE calculado a partir del proceso de selección de algoritmos se pueden encontrar en la Tabla complementaria S3. Del proceso de selección del modelo de regresión, se seleccionó RF Regressor para los datos de LDPE y KNN para los datos de PET y ABS. Luego, los datos de entrenamiento para cada muestra de MP se utilizaron para entrenar el modelo de referencia de los algoritmos seleccionados mediante el uso de configuraciones de hiperparámetros predeterminadas. A continuación, se eligieron para el ajuste los hiperparámetros n_estimators, max_ Depth y min_samples_split del regresor de RF para las muestras de LDPE. Las configuraciones leaf_size, n_neighbors yp para el regresor KNN se seleccionaron para ajustar las muestras de PET y ABS. Las mejores configuraciones de combinación de hiperparámetros se determinaron utilizando la función GridSearchCV en Scikit-Learn y los modelos ajustados con hiperparámetros entrenados utilizando el conjunto de datos de entrenamiento. Los modelos desarrollados se probaron utilizando los datos de prueba del 30% y las métricas de rendimiento de estos modelos se resumen en la Tabla 1. Se representa el gráfico de regresión de los valores previstos frente a los reales de los modelos (Fig. 3a, c). Se comparó el rendimiento de los modelos de referencia frente a los ajustados utilizando los valores MAE, MSE, RMSE y R2 calculados. Se trazaron curvas de aprendizaje para garantizar que los modelos no estuvieran sobreajustados (Figura complementaria S2).

Importancia de las características de las 15 características principales de (a) datos de LDPE, (b) PET y (c) ABS (obtenidos de la selección de características y funciones de regresor de RF en Scikit-Learn). Estos gráficos de importancia de características clasifican las longitudes de onda según la importancia en el desarrollo del modelo. Las longitudes de onda mejor clasificadas para LDPE, PET y ABS son 1072 nm, 333 nm y 367 nm, respectivamente. Los valores de reflectancia en estos puntos de longitud de onda se aplican durante el desarrollo de los modelos de regresión.

En la Fig. 2 se muestran las reflectancias promedio registradas con el espectrorradiómetro ASD HandHeld 2 VNIR en todas las concentraciones y todas las réplicas de cada muestra de sedimento microplástico (incluida una reflectancia promedio del sedimento de playa tratado sin plástico; diamante). Las reflectancias de PET (triángulo), ABS (cuadrado) y LDPE (círculo) fueron similares en forma pero separadas por intensidades de reflectancia: el PET registró el valor más alto y el LDPE el más bajo. Sólo el sedimento de playa tratado mostró dos superposiciones con LDPE alrededor de 570 nm y 720–800 nm. Las gráficas de reflectancia versus longitud de onda para los tres MP en cada nivel de concentración (0,1–15%) se muestran en la figura complementaria S1.

La selección de características utilizando RF Regresor y algoritmos de importancia de características se utilizó para clasificar las características importantes. La característica mejor clasificada (longitud de onda) para cada tipo de muestra de microplástico se utiliza para desarrollar el modelo de regresión. Específicamente, se utilizaron datos de reflectancia de 1072 nm, 333 nm y 367 nm para desarrollar modelos de regresión para muestras de LDPE, PET y ABS, respectivamente. Consulte la Tabla complementaria S1 para conocer los valores de importancia de las características de cada longitud de onda.

Desde el paso de ajuste del modelo de aprendizaje automático, el modelo de RF sintonizado para LDPE superó al modelo de referencia. Mientras tanto, no hubo mejoras en las métricas de error del modelo KNN sintonizado para PET. Por último, el modelo KNN sintonizado para ABS superó a su modelo de referencia. La Tabla 1 resume los mejores modelos de regresión para LDPE (modelo RF de referencia), PET (modelo KNN de referencia) y ABS (modelo KNN sintonizado). Consulte la Tabla complementaria S4 para comparar las métricas de evaluación entre los modelos de referencia y ajustados para todas las muestras de MP.

La Figura 4 resume las 15 longitudes de onda más importantes para los tres MP que utilizan PCA. Los gráficos de pedregal (ver Figura complementaria S3) mostraron que los dos primeros componentes principales explicaron más del 95% de la varianza total para los tres MP. Nuestro conjunto de datos para cada MP se redujo a 2 componentes principales sin perder muchos de los datos32. Como se mencionó anteriormente, la función fviz_cos2() se usó en la programación R para determinar el significado de cada longitud de onda en los componentes dados. Un estudio de Sagar et al. afirma que en un gran conjunto de datos multivariados hay muchas variables insignificantes que no son necesarias para crear el modelo de pronóstico33.

(a – c) Las 15 longitudes de onda más significativas de cada microplástico según el valor del coseno cuadrado en los dos primeros componentes principales, determinado utilizando la función fviz_cos2() en la programación R.

La Tabla 1 resume los gráficos de regresión desarrollados por los dos métodos. Los valores RMSE para los modelos de regresión PCA y los modelos de regresión lineal de aprendizaje automático fueron similares para LDPE y ABS, mientras que el valor RMSE para PET fue mejor usando el modelo de regresión PCA. Además, los valores de R2 también fueron mejores para el modelo de regresión PCA. Los gráficos de diagnóstico (Figuras complementarias S4, S5) para todos los modelos de regresión PCA mostraron una distribución normal de los residuos. Se observó en los gráficos QQ para cada modelo entrenado con MP (Figura complementaria S5) que los puntos caen aproximadamente en una línea diagonal, lo que indica que los términos residuales se distribuyen normalmente34.

A excepción del LDPE, las longitudes de onda significativas para PET y ABS se encontraban principalmente en el rango de 1020 a 1075 nm en el enfoque PCA. Por otro lado, las longitudes de onda significativas resaltadas mediante la técnica de importancia de características de ML generalmente se encontraban dentro del rango de 327 a 374 nm. Las longitudes de onda resaltadas indican que las longitudes de onda importantes para la predicción del modelo de regresión se encuentran en su mayoría dentro del rango ruidoso, como se ve en los diagramas de dispersión (consulte la figura complementaria S1). Para el enfoque ML, el ajuste de hiperparámetros tampoco resultó en ningún aumento significativo en las métricas de rendimiento del modelo de regresión, excepto en el caso del modelo de regresión RF. Esta observación es similar a otros informes donde los estudios han demostrado que la RF es un excelente algoritmo de ML incluso sin ajuste de hiperparámetros35. Sin embargo, este estudio muestra que los modelos de referencia RF y KNN para las muestras de LDPE y PET, respectivamente, dieron como resultado un buen rendimiento del modelo, mientras que el modelo KNN sintonizado tenía métricas de rendimiento ligeramente más altas que su modelo de referencia para la muestra de ABS. En general, el ajuste de hiperparámetros no contribuyó a mejoras significativas en ninguno de los modelos de regresión. La mejora progresiva en las curvas de aprendizaje para todos los modelos también indica que el aumento en el número de datos de entrenamiento mejora el rendimiento del modelo36. La curva de aprendizaje del modelo KNN para la muestra ABS tuvo la brecha más pequeña entre las curvas de error de entrenamiento y de validación, lo que indica una varianza baja del modelo y el modelo tuvo una varianza baja y una menor tendencia a sobreajustarse. Mientras tanto, el modelo de RF de referencia desarrollado utilizando la muestra de LDPE tenía una brecha ligeramente mayor entre las curvas de tren y de validación que los otros modelos. Esto indica lo contrario, es decir, el modelo tiene una varianza ligeramente (1) mayor y (2) posibilidad de sobreajuste. A pesar del conjunto de datos de entrenamiento relativamente pequeño, las métricas de rendimiento indican que los modelos estaban bien entrenados, especialmente para RF y KNN entrenados para predicciones de LDPE y ABS, respectivamente.

Los valores de RMSE, R2 y MAE (Tabla 1) fueron más favorables para los gráficos de regresión de PCA en comparación con los gráficos de regresión de aprendizaje automático. Comparando nuestro estudio con Corradini et al., donde los autores utilizaron un enfoque bayesiano para una regresión multilineal debido a que tienen un mayor número de variables que observaciones, nuestro método aborda este problema utilizando el enfoque PCA para la reducción de variables23. El enfoque PCA en nuestro estudio es más conveniente y rápido que el enfoque bayesiano. Dai et al. afirmó que PCA se ha utilizado ampliamente para la selección de características en conjuntos de datos espectrales y es un mejor enfoque cuando se trata de conjuntos de datos espectrales grandes que se supone que tienen una alta colinealidad37. Por lo tanto, después de la PCA, nos aseguramos de que las variables seleccionadas (longitudes de onda) no se ajustaran demasiado a los modelos entrenados observando los gráficos de diagnóstico de los modelos (Figuras complementarias S4, S5) y los valores de R2 con conjuntos de datos de prueba (Tabla 1). Sin embargo, para mejorar aún más y reducir las variables de los modelos de entrenamiento, realizar una regresión por pasos después de la selección de características puede ajustar los modelos entrenados37.

El valor RMSE para el modelo de LDPE es 2,3, lo que indica que, en promedio, el valor de concentración previsto se desvía del valor de concentración real en 2,3 (% en peso). Mientras que los valores de RMSE tanto para PET como para ABS fueron de 1,2. Los valores RMSE fueron mucho mejores para PET y ABS en comparación con LDPE. Corradini et al. encontraron que los valores RMSE para sus modelos LDPE y PET eran 0,8 y 1,8 (% en peso)23. Aunque el valor RMSE de nuestro modelo LDPE es ligeramente superior al de Corradini et al. pero el valor RMSE de nuestro modelo PET fue menor23. No obstante, al comparar los valores de RMSE del estudio realizado por Corradini et al., podemos asumir que nuestros valores de RMSE están dentro del rango aceptable23.

Un estudio de Moroni et al. destacó que las muestras de LDPE y PET alcanzan su punto máximo en longitudes de onda superiores a 1100 nm, el algoritmo de importancia de características aplicado en este estudio destacó diferentes rangos de importancia de longitud de onda para que los algoritmos de aprendizaje automático aprendan38. Generalmente, para PET y ABS, las características importantes están alrededor del rango de 300 nm, mientras que para LDPE están alrededor de los rangos de 300 nm y 700 nm. Esto indica que, aunque las muestras de LDPE y PET alcanzan su punto máximo y se reconocen mejor en longitudes de onda superiores a 1100 nm, estas longitudes de onda no son necesariamente importantes para el desarrollo de modelos de ML.

Hasta donde sabemos, no existen estudios que utilicen técnicas basadas en ML para la detección y cuantificación de MP en el suelo utilizando datos vis-NIR. El estudio relacionado más cercano realizado por Corradini et al. informaron la aplicación de regresión multilineal mediante la regresión de la concentración conocida de MP con lecturas de absorbancia a 350–2500 nm para muestras de LDPE y PET23. En Corradini et al. se aplicó un enfoque bayesiano para determinar el modelo de regresión lineal más probable23. En el mismo estudio, los valores de R2 informados fueron 0,95 y 0,87 respectivamente en comparación con 0,83 y 0,66 obtenidos en este estudio para LDPE y PET, respectivamente. Aunque los valores de R2 de Corradini et al. muestran mejores modelos de regresión, el límite de detección fue solo de 10 g kg-1 (1% p/p)23. Mientras tanto, nuestro estudio muestra un límite de detección más alto de hasta el 15% p/p de concentración de MP, particularmente para muestras de LDPE y ABS donde los valores de R2 son los más altos (R2 > 0,80). Teniendo en cuenta que la contaminación por MP en muestras de suelo suele superar el límite de detección del 1% p/p, existe la posibilidad de utilizar la técnica de regresión lineal vis-NIR y ML para la detección de una mayor concentración de MP en el sedimento del suelo20.

Se observó que algunas de las longitudes de onda significativas seleccionadas por ambos modelos se encontraban en la zona ruidosa del espectro, entre 325 y 350 nm (Fig. 3). Es posible que los algoritmos y el PCA confundieran la perturbación causada por los datos ruidosos en el espectro como la variable más significativa39.

Sin embargo, en este estudio, ambos enfoques generaron valores satisfactorios de R2, RMSE y MAE. Por lo tanto, utilizando el método de este estudio, es posible desarrollar modelos predictivos precisos utilizando el espectrorradiómetro ASD HandHeld 2 VNIR, que es una alternativa de bajo costo a los productos ASD FieldSpec de gama completa además de no requerir el uso de un procedimiento FTIR que requiere mucho tiempo y una preparación integral de muestras.

Para estudios adicionales, se pueden utilizar MP y tipos de polímeros de diferentes colores para crear los modelos de regresión, ya que los productos plásticos en nuestro entorno tienen una amplia gama de colores y materiales.

Nuestro estudio explora dos enfoques en la espectroscopia vis-NIR de MP del suelo. En primer lugar, se midieron las reflectancias de tres microplásticos vírgenes diferentes en sedimentos de playa tratados, estandarizando así la muestra de suelo. En segundo lugar, se desarrollaron modelos de regresión mediante PCA y algoritmos de regresión de aprendizaje automático para predecir los MP en la muestra de suelo.

Los resultados muestran que los mejores modelos de regresión lineal desarrollados para LDPE, PET y ABS utilizando algoritmos de aprendizaje automático dieron como resultado valores R2 de 0,83, 0,66 y 0,86 con valores RMSE de 1,9, 2,7 y 1,7, respectivamente. Los mejores modelos desarrollados fueron los del modelo de referencia, excepto el LDPE, donde el ajuste de hiperparámetros dio como resultado métricas de precisión ligeramente superiores en comparación con su modelo de referencia. Las curvas de aprendizaje también indicaron que la precisión de los modelos aumentó con respecto al número de datos de entrenamiento, lo que sugiere que los modelos de ML se pueden mejorar aún más agregando más datos de entrenamiento. Estudios anteriores sobre la detección de MP han mostrado límites de detección bajos. Si bien el límite de detección no se cuantificó en este estudio, las métricas de precisión relativamente altas desarrolladas para muestras con una concentración de MP de hasta el 15 % p/p indican el potencial de utilizar esta técnica para detectar MP con un límite de detección más alto. Por otro lado, la técnica de regresión PCA también mostró varias ventajas. Los valores de R2 para los modelos LDPE, PET y ABS fueron 0,83, 0,94 y 0,44 con valores RMSE de 2,3, 1,2 y 1,2, respectivamente. Las métricas de rendimiento de estos modelos indican que es posible desarrollar modelos predictivos precisos utilizando la opción de bajo costo ASD HandHeld 2 VNIR Spectroradiometer.

Los conjuntos de datos generados y/o analizados durante el estudio actual están disponibles del autor correspondiente a solicitud razonable.

Thompson, RC, Swan, SH, Moore, CJ y vom Saal, FS Nuestra era del plástico. Filos. Trans. R. Soc. B Biol. Ciencia. 364, 1973-1976 (2009).

Artículo de Google Scholar

An, L. et al. Microplásticos en ambientes terrestres. Mano. Reinar. Química. 95, 143-159 (2020).

Google Académico

Horton, AA, Walton, A., Spurgeon, DJ, Lahive, E. & Svendsen, C. Microplásticos en ambientes terrestres y de agua dulce: evaluación de la comprensión actual para identificar las lagunas de conocimiento y las prioridades de investigación futuras. Ciencia. Medio ambiente total. 586, 127-141 (2017).

Artículo ADS CAS PubMed Google Scholar

Ter Halle, A. et al. Nanoplástico en el giro subtropical del Atlántico norte. Reinar. Ciencia. Tecnología. 51, 13689–13697 (2017).

Artículo ADS PubMed Google Scholar

Anbumani, S. & Kakkar, P. Efectos ecotoxicológicos de los microplásticos en la biota: una revisión. Reinar. Ciencia. Contaminación. Res. En t. 25, 14373–14396 (2018).

Artículo CAS PubMed Google Scholar

Chae, Y. & An, YJ Tendencias actuales de investigación sobre la contaminación plástica y los impactos ecológicos en el ecosistema del suelo: una revisión. Reinar. Contaminación. 240, 387–395 (2018).

Artículo CAS PubMed Google Scholar

de Souza Machado, AA, Kloas, W., Zarfl, C., Hempel, S. & Rillig, MC Los microplásticos como una amenaza emergente para los ecosistemas terrestres. Globo. Cambiar Biol. 24, 1405-1416 (2018).

ADS del artículo Google Scholar

Campanale, C., Massarelli, C., Savino, I., Locaputo, V. y Uricchio, VF Un estudio de revisión detallado sobre los efectos potenciales de los microplásticos y aditivos preocupantes en la salud humana. En t. J. Medio Ambiente. Res. Salud Pública 17, 1212 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Rahman, I., Mujahid, A., Palombo, E. y Müller, M. Un análisis funcional de conjuntos de genes de comunidades microbianas que se asientan en microplásticos en un entorno con drenaje de turba. Mar. Contaminación. Toro. 166, 112226 (2021).

Artículo CAS PubMed Google Scholar

Shahul Hamid, F. y otros. Distribución mundial y abundancia de microplásticos: ¿Cuán grave es la situación?. Gestión de residuos. Res. 36(10), 873–897 (2018).

Artículo de Google Scholar

Él, D. et al. Microplásticos en suelos: métodos analíticos, características de contaminación y riesgos ecológicos. Anal de tendencias. Química. 109, 163-172 (2018).

Artículo CAS Google Scholar

Gionfra, S. Contaminación plástica en el suelo. https://www.isqaper-is.eu/key-messages/briefing-papers/125-plastic-pollution-in-soil (2018).

Bouwmeester, H., Hollman, PC & Peters, RJ Impacto potencial en la salud de los micro y nanoplásticos liberados al medio ambiente en la cadena de producción de alimentos humanos: experiencias de la nanotoxicología. Reinar. Ciencia. Tecnología. 49, 8932–8947 (2015).

Artículo ADS CAS PubMed Google Scholar

Bläsing, M. & Amelung, W. Plásticos en el suelo: métodos analíticos y posibles fuentes. Ciencia. Medio ambiente total. 612, 422–435 (2018).

Artículo ADS PubMed Google Scholar

Nizzetto, L., Langaas, S. & Futter, M. Contaminación: ¿Los microplásticos se derraman en los suelos agrícolas? Naturaleza 537, 488 (2016).

Artículo ADS CAS PubMed Google Scholar

Duis, K. & Coors, A. Microplásticos en el medio acuático y terrestre: fuentes (con especial atención en productos de cuidado personal), destino y efectos. Reinar. Ciencia. EUR. 28, 2 (2016).

Artículo PubMed PubMed Central Google Scholar

Rillig, MC, Ziersch, L. & Hempel, S. Transporte de microplásticos en el suelo por lombrices de tierra. Ciencia. Rep. 7, 1362 (2017).

Artículo ADS PubMed PubMed Central Google Scholar

Huang, J. y col. Contaminación por microplásticos en suelos y aguas subterráneas: características, métodos analíticos e impactos. Química. Ing. J. 425, 131870 (2021).

Artículo CAS Google Scholar

Yang, L., Zhang, Y., Kang, S., Wang, Z. y Wu, C. Microplásticos en el suelo: una revisión de los métodos, la aparición, las fuentes y el riesgo potencial. Ciencia. Medio ambiente total. 780, 146546 (2021).

Artículo ADS CAS PubMed Google Scholar

Ng, W., Minasny, B. y McBratney, A. Red neuronal convolucional para la detección de contaminación microplástica del suelo mediante espectroscopia infrarroja. Ciencia. Medio ambiente total. 702, 134723 (2020).

Artículo ADS CAS PubMed Google Scholar

Wang, W., Ge, J., Yu, X. & Li, H. Destino ambiental e impactos de los microplásticos en los ecosistemas del suelo: progreso y perspectiva. Ciencia. Medio ambiente total. 708, 134841 (2020).

Artículo ADS CAS PubMed Google Scholar

Löder, MGJ & Gerdts, G. Metodología utilizada para la detección e identificación de microplásticos: una evaluación crítica. En Marine Anthropogenic Litter (ed. Bargeman, M., Gutow, G. y Klages, M.). 201–227 (2015).

Corradini, F., Bartholomeus, H., Huerta Lwanga, E., Gertsen, H. y Geissen, V. Predicción de la concentración de microplásticos del suelo mediante espectroscopia vis-NIR. Ciencia. Medio ambiente total. 650, 922–932 (2019).

Artículo ADS CAS PubMed Google Scholar

Manley, M. Espectroscopia de infrarrojo cercano e imágenes hiperespectrales: análisis no destructivo de materiales biológicos. Química. Soc. Rev. 43, 8200–8214 (2014).

Artículo CAS PubMed Google Scholar

Chaczko, Z., Wajs-Chaczko, P., Tien, D. y Haidar, Y. Detección de microplásticos mediante aprendizaje automático. En Conferencia Internacional sobre Aprendizaje Automático y Cibernética (ICMLC). 1–8 (2019).

Chen, Y. et al. Identificación y cuantificación de microplásticos mediante espectroscopía infrarroja por transformada de Fourier: estado actual y perspectivas de futuro. actual. Opinión. Reinar. Ciencia. Salud 18, 14-19 (2020).

Artículo de Google Scholar

Harshitha, NK, Varghese, LS, Harshitha, MR y Jinsha, VK Detección de microplásticos en agua mediante procesamiento de imágenes. En t. J. Aplica. Ing. Res. 15, 85–88 (2020).

Google Académico

Massarelli, C., Campanale, C. & Uricchio, VF Una práctica aplicación de código abierto basada en visión por computadora y algoritmos de aprendizaje automático para contar y clasificar microplásticos. Agua 13, 2104 (2021).

Artículo de Google Scholar

Jang, FHA Interacción de microplásticos con trazas de metales y bacterias; y posibles impactos sobre los peces. Tesis doctoral, Universidad Tecnológica de Swinburne Sarawak, Malasia (2020).

Pedregosa, F. et al. Scikit-learn: aprendizaje automático en Python. J. Mach. Aprender. Res. 12, 2825–2830 (2011).

MathSciNet MATEMÁTICAS Google Scholar

Saarela, M. & Jauhiainen, S. Comparación de medidas de importancia de características como explicaciones para modelos de clasificación. Aplica SN Ciencia. 3, 272 (2021).

Artículo de Google Scholar

Jolliffe, IT & Cadima, J. Análisis de componentes principales: una revisión y desarrollos recientes. Filos. Trans. Una Matemática. Física. Ing. Ciencia. 374, 20150202 (2016).

ADS MathSciNet PubMed PubMed Central MATEMÁTICAS Google Scholar

Sagar, P., Gupta, P. & Kashyap, I. Un método de pronóstico con selección eficiente de variables en conjuntos de datos multivariados. En t. J.Inf. Tecnol. 13, 1039-1046 (2021).

Artículo de Google Scholar

James, G., Witten, D., Hastie, T. y Tibshirani, R. Regresión lineal. En Introducción al aprendizaje estadístico: con aplicaciones (eds James, G. et al.) 59–129 (Springer, 2013).

Capítulo MATEMÁTICAS Google Scholar

Probst, P., Boulesteix, AL y Bischl, B. Capacidad de ajuste: importancia de los hiperparámetros de los algoritmos de aprendizaje automático. J. Mach. Aprender. Res. 20, 1–32 (2019).

MathSciNet MATEMÁTICAS Google Scholar

Raschka, S. & Mirjalili, V. Aprendizaje automático con Python: aprendizaje automático y aprendizaje profundo con Python, Scikit-learn y TensorFlow, 2.ª ed. (Packt Publishing, 2017).

Google Académico

Dai, Q., Cheng, JH, Sun, DW y Zeng, XA Avances en los métodos de selección de características para el procesamiento de imágenes hiperespectrales en aplicaciones de la industria alimentaria: una revisión. Crítico. Rev. Ciencia de los alimentos. Nutrición. 55, 1368-1382 (2015).

Artículo CAS PubMed Google Scholar

Moroni, M., Mei, A., Leonardi, A., Lupo, E. & Marca, FL Separación de PET y PVC con imágenes hiperespectrales. Sensores 15, 2205–2227 (2015).

Artículo ADS PubMed PubMed Central Google Scholar

Renner, G. y col. Preprocesamiento y evaluación de datos utilizados en el proceso de identificación de microplásticos: una revisión crítica y una guía práctica. Anal de tendencias. Química. 111, 229–238 (2019).

Artículo CAS Google Scholar

Descargar referencias

Los autores desean agradecer al Dr. Xavier Chee del campus de Sarawak de la Universidad Tecnológica de Swinburne por su ayuda con la recolección de muestras de suelo.

Facultad de Ingeniería, Computación y Ciencias, Universidad Tecnológica de Swinburne, Campus Sarawak, 93350, Kuching, Sarawak, Malasia

Faisal Raiyan Huda, Florina Stephanie Richard, Ishraq Rahman, Clarence Tay Yuen Hua, Christabel Anfield Sim Wanwen, Ting Lik Fong y Moritz Müller

Facultad de Ciencias, Universidad Thompson Rivers, 805 TRU Way, Kamloops, BC, V2C0C8, Canadá

Faisal Raiyan Huda y Saeid Moradi

Instituto de Energía Sostenible y Renovable (ISuRE), Universiti Malaysia Sarawak, Kota Samarahan, 94300, Sarawak, Malasia

Aazani Mujahid

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

FRH: conceptualización, investigación, análisis formal, redacción—borrador original. FSR: software, análisis formal, redacción: revisión y edición. IR: análisis formal, redacción: revisión y edición. SM: análisis formal. CTYH: redacción: revisión y edición. CASW: redacción: revisión y edición. TLK: supervisión. AM: supervisión. MM: supervisión, metodología, redacción—revisión y edición. Todos los autores leyeron y aprobaron el manuscrito final.

Correspondencia a Moritz Müller.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Huda, FR, Richard, FS, Rahman, I. et al. Comparación de modelos de aprendizaje para predecir concentraciones de LDPE, PET y ABS en sedimentos de playas en función de la reflectancia espectral. Representante científico 13, 6258 (2023). https://doi.org/10.1038/s41598-023-33207-x

Descargar cita

Recibido: 03 de julio de 2022

Aceptado: 09 de abril de 2023

Publicado: 17 de abril de 2023

DOI: https://doi.org/10.1038/s41598-023-33207-x

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR