会员中心     
首页 > 资料专栏 > 经营 > 常用范文 > 工作总结 > 郭同学赛意港融科技面试总结20201013DOC

郭同学赛意港融科技面试总结20201013DOC

hszmplo***
V 实名认证
内容提供者
热门搜索
融科 面试总结
资料大小:5KB(压缩后)
文档格式:DOC(3页)
资料语言:中文版/英文版/日文版
解压密码:m448
更新时间:2024/12/26(发布于广东)

类型:积分资料
积分:8分 (VIP无积分限制)
推荐:免费申请

   点此下载 ==>> 点击下载文档


文本描述
赛意初试(通过)
介绍一下你的项目经历。
答:我就讲一下我最近的一个项目吧,因为比较熟悉,我最近的一个项目是关于电力系统交易数据分析的BI项目。我主要的工作负责报表层也就是DM层,主要工作内容就是将DW层的数据同步到DM层,之后通过帆软进行报表展示。
讲一下你在项目中用到的工具。
答:最早做ETL的时候用的是kettle进行抽数,之后做报表的时候是用的帆软进行报表展示。
同步数据的话是用的全量还是增量。
答:都有用过,平常的话增量用的比较多。
增量同步数据你是怎么实现的。
答:通过建一个游标指向一个结果集,然后循环取出数据,如果主键相同就更新数据,如果没有对应的主键就插入数据
使用cursor实现不会遇到性能问题吗?你们的数据量有多大?你遇到过的最大数据量有多大?用cursor同步这些数据需要多久的时间?
答:可能是因为我的数据量比较小吧,没有遇到过太多性能问题。我平常接触表就2、3百万条数据,遇到过最大的也就只有800w。用cursor同步200w的数据大概需要5分钟左右。
如何把一张普通表转换成分区表?
答:这个我不是很清楚,分区表这一块是同事做的。
如果分区表使用时间戳为依据,时间戳发生改变时是否会报错。
答:这个问题我没有遇到过,我感觉应该会报错。
在同步数据时如何创建索引。
答:这个我不是很清楚,创建索引这一块是同事做的。
创建索引时需要考虑什么?
答:同上
赛意复试(感觉挂了)
自我介绍。
我就介绍了一下基本信息,以及转行的原因和离职原因。
介绍一下你做的项目以及你自己的职责。
答:我就讲一下我最近的一个项目吧,因为比较熟悉,我最近的一个项目是关于电力系统交易数据分析的BI项目。我主要的工作负责报表层也就是DM层,主要工作内容就是将DW层的数据同步到DM层,之后通过帆软进行报表展示。
你们用的调度工具是什么?有没有亲自使用过CTM。
答:用的CTM ,是同事进行配置的自己没有使用过。
DML,DDL分别是什么?各包含什么语句?
答:(这里我是有印象但是实在记不清)我知道DDL DML DCL之类的对应的是 数据控制语言 数据查询语言之类的,但是具体谁对应谁 我记不太清了。
是否了解缓慢变化维?
答:我对缓慢变化维的了解仅仅是在拉链表的实现。
是否使用过分区表?是以什么为依据创建的?你们项目里的分区表叫什么名字?
答:使用过,以时间戳为依据创建的,一般一个月作为一个分区,项目里的分区表就叫日期分区表
维度和度量是什么?
答:维度就是比如说,我们根据需求,将事实表按照不同的维度建立维度表,比如说我之前的项目就按照交易客户,和交易类型维度建立维度表。
度量我不是很清楚。
如果有五张表进行关联,主键唯一,查询的时候效率很慢,请问怎么优化?
答:我先说隐式转换 ,他说不存在隐式转换,我又说数据发散,他也说不存在,然后我就说我不清楚了。
如果你做的报表展示之后,用户说你报表中有某一个数据错误,请问你怎么解决?
答:我都是直接去找上游询问看看是否他们的数据就有问题。
港融科技面试:(通过)
自我介绍。
同上
什么数据库用的最多(最熟悉哪个数据库)
答:oracle用的最多,mysql也有一些了解
MERGE 和UPDATE有什么区别
答:他们有什么区别的话我不是很清楚,在增量同步中我一般用的merge into的话 merge后面跟的是目标表, 然后如果when matched 就update,如果not matched 就insert
ROWNUMBER和ROWID有什么区别。
答:ROWNUMBER主要是用来排序的,而ROWID是物理地址,主要用来去重。
FULL JOIN 和INNER JOIN 的区别。
答:FULL JOIN会显示两张表的所有内容,INNER JOIN 只会显示根据链接