数据工程师面试题
数据库基础
- 什么是事务?事务的 ACID 特性是什么?
- 什么是索引?索引的作用是什么?
- 什么是锁?锁的作用是什么?
- 什么是隔离级别?隔离级别有哪些?
- 什么是数据库的范式?数据库的范式有哪些?
数据仓库
- OLAP 和 OLTP 的区别是什么?
- 湖仓数据库 中 Delta/Hudi/Iceberg 格式和 Parquet 格式的区别是什么?
- SCD 有哪些类型?如何实现?
数仓运维
- 接触过哪些不同的数据源?各种数据源怎么进行增量数据抽取?
- ELT 开发和测试的流程是什么?如何做变更管理
- 如何应对 schema evolution?
- DataOps 是什么?有什么作用?
- 如何做数据治理?数据质量、数据安全、数据监控
Python
- Python 的 GIL(Global Interpreter Lock)是什么?有什么影响?
- Python 中的装饰器是什么?有什么作用?
- 对于 IO 密集型的任务,如何提高性能?
- 对于 CPU 密集型的任务,如何提高性能?