Skip to main content

数据工程师面试题

数据库基础

  • 什么是事务?事务的 ACID 特性是什么?
  • 什么是索引?索引的作用是什么?
  • 什么是锁?锁的作用是什么?
  • 什么是隔离级别?隔离级别有哪些?
  • 什么是数据库的范式?数据库的范式有哪些?

数据仓库

  • OLAP 和 OLTP 的区别是什么?
  • 湖仓数据库 中 Delta/Hudi/Iceberg 格式和 Parquet 格式的区别是什么?
  • SCD 有哪些类型?如何实现?

数仓运维

  • 接触过哪些不同的数据源?各种数据源怎么进行增量数据抽取?
  • ELT 开发和测试的流程是什么?如何做变更管理
  • 如何应对 schema evolution?
  • DataOps 是什么?有什么作用?
  • 如何做数据治理?数据质量、数据安全、数据监控

Python

  • Python 的 GIL(Global Interpreter Lock)是什么?有什么影响?
  • Python 中的装饰器是什么?有什么作用?
  • 对于 IO 密集型的任务,如何提高性能?
  • 对于 CPU 密集型的任务,如何提高性能?