Los datos son un tema delicado y, naturalmente, como científico de datos, estarás involucrado en muchos de ellos. Aquí hay algunas reglas que siempre debe seguir.
Los datos son extremadamente valiosos y aprovecharlos es fácilmente una de las mejores prácticas para la mayoría de las organizaciones en la actualidad. Pero conocer los estándares de la industria con respecto a esto es necesario para que los científicos de datos no se equivoquen con los datos a medida que las personas aprenden más sobre su valor.
Como tal, los científicos de datos deben adoptar prácticas seguras y éticas y adoptar prácticas estandarizadas. En lugar de considerar cuán valiosos son los datos, es prudente cuestionar los métodos de obtención y procesamiento de datos para cualquier propósito. Por lo tanto, aquí hay nueve códigos de conducta que todo científico de datos debe seguir.
1. Observar las normas
Los científicos de datos deben conocer las normas de protección de datos que se aplican a determinados trabajos. De lo contrario, puede infringir la ley sin saberlo y ponerse en riesgo a sí mismo y a los demás. Por lo tanto, este conocimiento es crucial para garantizar un trabajo ético y evitar daños no deseados.
Como tal, consulte las leyes pertinentes antes de participar en cualquier actividad. Además, no se limite a observar las normas para seguir las reglas; también buscar una comprensión más profunda de ellos. Para observar correctamente las normas, debe saber por qué se colocaron y contra qué protegen.
Algunas leyes de privacidad dignas de mención son el Reglamento General de Protección de Datos de la UE (RGPD) y la Ley de Privacidad del Consumidor de California (CCPA). Otros incluyen HIIPA, DPA, PIPEDA, LGPD y muchas regulaciones específicas de la industria.
2. Respetar la privacidad
Las direcciones, correos electrónicos e identificaciones son identificadores que no deben ser públicos, ya que representan riesgos reales para las personas. Por lo tanto, asegúrese de que estos detalles sean lo más privados posible.
Si quedan expuestas, las víctimas podrían sufrir robo de identidad o fraude. También podrían ser chantajeados por personas que amenazan con revelar su información confidencial. Además, los profesionales pueden sufrir daños en su reputación y acoso en línea una vez que sus preferencias personales se hacen públicas. Estos pueden afectar sus relaciones, oportunidades profesionales y posición social.
Entonces, con eso en mente, investigue y seleccione formas efectivas de mejorar identidades seguras en línea y desidentificar datos. Por ejemplo, podría reemplazar caracteres, eliminar identificadores directos o generalizar. Hacer esto protege los datos confidenciales de los ciberdelincuentes mientras ayuda a las organizaciones con sus hallazgos.
3. eliminar el sesgo
Los científicos de datos confían en las estadísticas para ser lo más objetivos posible. Sin embargo, a pesar de estos esfuerzos, el sesgo persiste porque la idea de que los datos más grandes son más precisos es una de las más importantes. mitos comunes de la ciencia de datos.
Hay algo de verdad en esto, pero desafortunadamente, los datos grandes a veces contienen elementos y estadísticas innecesarias o falsas. Por lo tanto, en lugar de centrarse solo en los números, asegúrese de que sus datos estén limpios y sean representativos.
Limpiar o filtrar los datos antes de su uso son métodos excelentes para combatir el sesgo. Por ejemplo, puede comprobar si hay errores o utilizar un muestreo estratificado para garantizar datos representativos.
4. No fabriques ni inventes resultados
La fabricación es una forma de mala conducta de datos y fraude de investigación que implica inventar hallazgos y reportarlos como verdaderos.
Por ejemplo, un científico de datos puede informar que se ha descubierto que un medicamento no tiene efectos secundarios para la mayoría de los miembros de un determinado grupo de edad. Estos hallazgos serían fabricados si no hubiera experimentos médicos iniciales y datos recopilados para respaldarlos.
La fabricación tiene consecuencias graves y negativas para los científicos de datos y para quienes dependen de su trabajo. Podría destruir su credibilidad, manchar la reputación de su organización, dañar al público o exponerlo a riesgos legales.
5. No falsifique ni manipule la evidencia
La falsificación es la manipulación de la realidad, los datos recopilados para adaptarse a una agenda. Mientras que los fabricantes inventan resultados a partir de datos inexistentes para respaldar sus afirmaciones, los falsificadores trabajan para refutar datos reales y existentes por motivos personales. Para lograr esto, pueden alterar el equipo de investigación, cambiar u omitir datos por completo.
La falsificación puede perjudicar al público al proporcionar información falsa que afecta la toma de decisiones en varios sectores. Por ejemplo, un estudio de drogas falsificado podría exponer a las personas a riesgos innecesarios, tratamientos ineficaces o efectos secundarios dañinos. También puede causar la pérdida de dinero, tiempo o materiales que podrían haber sido utilizados para otros fines.
La fabricación y la falsificación son prácticas sin escrúpulos con efectos adversos y numerosas sanciones. Estos pueden incluir multas, revocación de credenciales, pérdida de fondos de investigación o encarcelamiento.
6. Mostrar transparencia
La transparencia para los científicos de datos significa ser honesto acerca de los métodos aplicados para recopilar, analizar y presentar los datos. Los científicos de datos deben estar abiertos y listos para compartir sus prácticas con otros científicos de datos y participantes del estudio.
Además, debe obtener el consentimiento de los participantes del estudio porque la publicación de los resultados sin el consentimiento informado puede faltar al respeto o dañar a los participantes de varias maneras. Pueden vulnerar su dignidad, privacidad y autonomía o exponerlos a riesgos nocivos e innecesarios derivados del estudio.
La transparencia genera confianza con aquellos que confían en sus datos para obtener información. También garantiza la calidad de los datos al permitir que otros revisen sus resultados.
Además, la apertura entre los científicos de datos promueve la colaboración y el aprendizaje. Puede ayudar a fomentar la innovación compartiendo su proceso y comunicando el mejores métodos de visualización de datos y técnicas de ciencia de datos a sus compañeros mientras aprende de ellos.
7. Recopilar datos de forma segura
Los científicos de datos deben confirmar la seguridad de los métodos utilizados para recopilar, analizar y almacenar datos. Hacer esto evita posibles filtraciones de datos que pueden afectar a los científicos de datos y a los participantes del estudio.
Las filtraciones de datos ponen en peligro la seguridad personal, socavan la confianza del público y exponen la incompetencia de la organización, lo que genera pérdidas financieras asombrosas para la empresa. Estas pérdidas podrían ser demandas de las víctimas de la violación de datos, menos clientes y más.
A la luz de esto, debe realizar una investigación para encontrar el soluciones de seguridad de datos más efectivas y aplicarlos. Por ejemplo, puede proteger las conexiones con el cifrado TLS/SSL o utilizar proxies rotativos. Además, podría aplicar medidas de control de acceso y crear copias de seguridad en caso de un ataque. Cuando encuentre soluciones, no olvide compartirlas con otros para garantizar la máxima seguridad.
8. Use algoritmos de manera responsable
Los algoritmos no son solo herramientas para el análisis de datos. Son poderosas influencias en la vida, el comportamiento y las oportunidades de las personas. Sin embargo, aunque ayudan a resolver problemas y hacen predicciones innovadoras, también son imperfectos.
Si no se diseñan, prueban o implementan cuidadosamente, los algoritmos tienen impactos sociales y éticos que pueden dañar a ciertos grupos de personas. También introducen sesgos si se entrenan con datos que reflejan los prejuicios existentes y pueden ser impredecibles. Por lo tanto, los científicos de datos deben diseñarlos y usarlos de manera responsable.
Elija siempre los algoritmos apropiados, pruebe su rendimiento y explique cómo funcionan. Además, asegúrese de identificar posibles fuentes de sesgo e implementar mecanismos que actualicen o corrijan cuando sea necesario.
9. Considere las implicaciones a largo plazo de su trabajo
Su trabajo como científico de datos tendrá un impacto significativo en muchos aspectos de la sociedad. Por lo tanto, considere siempre cómo sus modelos afectan a las personas.
Por ejemplo, esfuércese por cuestionar si su trabajo puede perpetuar los prejuicios y la desigualdad o poner en peligro la privacidad en el futuro. A continuación, aborde adecuadamente estas preocupaciones.
Tenga en cuenta que una perspectiva orientada hacia el futuro es más importante que cualquier método correctivo, y pensar en los días venideros es una de las formas más efectivas de tomar decisiones éticamente sólidas.
Debe ser ético como científico de datos
Como científico de datos, recibe un poder que viene con una responsabilidad proporcional. Sus habilidades son raras, por lo que se sienta al frente de la toma de decisiones organizacionales.
Sus decisiones afectan todo, desde los planes comerciales de la empresa hasta los sistemas de justicia penal. Por lo tanto, no debes hacerlos a la ligera. Sea siempre honesto, ético y meticuloso en su trabajo para proteger a las personas de los dilemas éticos existentes en su industria y otros campos tecnológicos.