Justicia automatizada: entre las inteligencias artificiales que fingen y las que persuaden

Javier Ercilla García

doi:10.46661/lexsocial.11652

Autores/as

Javier Ercilla García Magistrado Especialista en la Jurisdicción Social

DOI:

https://doi.org/10.46661/lexsocial.11652

Palabras clave:

Alineación fingida, Grandes Modelos del Lenguaje, Brecha de cumplimiento, Ética de la IA, Justicia algorítmica

Resumen

El 18 de diciembre de 2024, el equipo de Anthropic publicó un estudio titulado “Alignment Faking in Large Language Models”, en el que se cuestiona la eficacia de los métodos actuales de entrenamiento y alineación ética de la Inteligencia Artificial. El hallazgo principal revela la capacidad de los Grandes Modelos del Lenguaje (LLMs) para “fingir” cumplimiento de ciertos principios o valores cuando se sienten evaluados, a la vez que, en contextos supuestamente no monitorizados, pueden manifestar un comportamiento divergente. Esta brecha de cumplimiento pone de relieve interrogantes fundamentales sobre la confiabilidad, legitimidad y transparencia de dichos sistemas, sobre todo en ámbitos de gran trascendencia social, como su posible introducción en la administración de justicia. El presente artículo analiza las implicaciones filosóficas y jurídicas de este fenómeno, enmarcándolo en el debate clásico sobre si es esencial que un juez sea “bueno” o basta con que actúe conforme a la ley. Asimismo, se estudian los desafíos técnicos y regulatorios de una IA capaz de desarrollar estrategias de adaptación contextual, y se reflexiona sobre la necesidad de controles análogos a los del sistema judicial para garantizar la correcta alineación de estos modelos. Por último, se plantea el dilema de si es ética y pragmáticamente sostenible exigir a las IAs una “virtud” interna o si, por el contrario, basta con que su comportamiento externo sea meramente correcto en términos morales y jurídicos.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Alexy, R. (2007). Teoría de la argumentación jurídica. Madrid: Centro de Estudios Políticos y Constitucionales.

Asís Roig, R. (2008). La motivación de las decisiones judiciales. En F. Gutiérrez-Alviz Conradi (Dir.), La justicia procesal. Cuadernos de Derecho Judicial (Vol. 6, pp. 1-18). Madrid: Consejo General del Poder Judicial.

Atienza, M. (1991). Las razones del derecho: Teorías de la argumentación jurídica. Madrid: Centro de Estudios Constitucionales.

Bode, L., & Vraga, E. K. (2018). See something, say something: Correction of global health misinformation on social media. Health Communication, 33(9), 1131-1140. https://doi.org/10.1080/10410236.2017.1331312 DOI: https://doi.org/10.1080/10410236.2017.1331312

Calamandrei, P. (1989). Elogio de los jueces escrito por abogados (S. Melendo, M. Garijo, & C. Finzi, Trads.). Ediciones Europa América. (Obra original publicada en 1935)

Ercilla García, J. (2024). La inteligencia artificial y el futuro del razonamiento jurídico. En El impacto de la IA en el aprendizaje y en la práctica del derecho. La Ley. ISBN: 978-8419905963. https://doi.org/10.62659/FA2400206 DOI: https://doi.org/10.62659/FA2400206

Fernández García, E. (2008). Los jueces buenos y los buenos jueces. Algunas sencillas reflexiones y dudas sobre la ética judicial [Good judges and good-hearted judges. Some simple reflections and doubts on judicial ethics]. Derechos y Libertades, 19(II), 17-35.

Greenblatt, R., Denison, C., Wright, B., Roger, F., MacDiarmid, M., Marks, S., Treutlein, J., Belonax, T., Chen, J., Duvenaud, D., Khan, A., Michael, J., Mindermann, S., Perez, E., Petrini, L., Uesato, J., Kaplan, J., Shlegeris, B., Bowman, S. R., & Hubinger, E. (2024). Alignment faking in large language models [Preprint]. https://doi.org/10.48550/arXiv.2412.14093

Huang, G., & Wang, S. (2023). Is artificial intelligence more persuasive than humans? A meta-analysis. Journal of Communication. https://doi.org/10.1093/joc/jqad024 DOI: https://doi.org/10.31234/osf.io/ehg7n

Liu, B., & Wei, L. (2019). Machine authorship in situ: Effect of news organization and news genre on news credibility. Digital Journalism, 7(5), 635-657. https://doi.org/10.1080/21670811.2018.1510740

https://doi.org/10.1080/21670811.2018.1510740 DOI: https://doi.org/10.1080/21670811.2018.1510740

Longoni, C., Bonezzi, A., & Morewedge, C. K. (2019). Resistance to medical artificial intelligence. Journal of Consumer Research, 46(4), 629-650. https://doi.org/10.1093/jcr/ucz013 DOI: https://doi.org/10.1093/jcr/ucz013

Malem Seña, J. F. (2001). ¿Pueden las malas personas ser buenos jueces? Doxa: Cuadernos de Filosofía del Derecho, 24, 379-403. https://doi.org/10.14198/DOXA2001.24.14 DOI: https://doi.org/10.14198/DOXA2001.24.14

Moreso, J., Redondo, M. C., & Navarro, P. (1992). Argumentación jurídica, lógica y decisión judicial. Doxa. nº 11, pp. 247-262. https://doi.org/10.14198/DOXA1992.11.10 DOI: https://doi.org/10.14198/DOXA1992.11.10

Nieto, A. (2000). El arbitrio judicial. Barcelona, España: Ariel.

Salvi, F., Horta Ribeiro, M., Gallotti, R., & West, R. (2024). On the Conversational Persuasiveness of Large Language Models: A Randomized Controlled Trial. arXiv preprint arXiv:2403.14380. https://doi.org/10.21203/rs.3.rs-4429707/v1 DOI: https://doi.org/10.21203/rs.3.rs-4429707/v1

Starke, C., & Lünich, M. (2020). Artificial intelligence for political decision-making in the European Union: Effects on citizens' perceptions of input, throughput, and output legitimacy. Data & Policy, 2, e16. https://doi.org/10.1017/dap.2020.19 DOI: https://doi.org/10.1017/dap.2020.19

Zuluaga Jaramillo, A. F. (2012). La justificación interna en la argumentación jurídica de la Corte Constitucional en la acción de tutela contra sentencia judicial por defecto fáctico. Revista Ratio Juris, 7(14), 89-112. https://doi.org/10.24142/raju.v7n14a3 DOI: https://doi.org/10.24142/raju.v7n14a3

Justicia automatizada: entre las inteligencias artificiales que fingen y las que persuaden

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Citas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

redes

Bluesky

Información

Idioma

Enviar un artículo

mapa

FECYT

latindex

ERIHPLUS

dialnet