轻量级Open edX数据分析系统的设想

Open edX包含一个数据分析系统Insights。它包含三个组件:

  • Pipeline,用于将LMS的log文件归集到Hadoop进行计算,并把计算结果写入Mysql。
  • DataAPI,用于将Mysql中的分析结果输出给Insights使用。
  • Insights,用于展示分析结果。

目前是一个重量级的系统。针对的是edx.org这种千万级别的用户网站产生的数据。大量的log被输送到Hadoop进行离线计算用来展示。因此对于小规模的Open edX部署,数万人级别的用户,这样的计算太繁琐。

我们计划开发一个轻量级的数据分析系统。有两个主要方向:

  • 使用python计算来取代hadoop,实现一个基于pandas的pipeline。还在insights里面展现
  • 直接在Inistructor Dashboard里面加入分析展现。可以看整个课程,或者单个学生的学习分析

这两个系统会全部开源。有兴趣一起研究的朋友可以参与。

Open edX Ginkgo.2 OVA镜像文件下载

镜像基于官方文档制作。去掉了Insights和AnalyticsAPI。

https://openedx.atlassian.net/wiki/spaces/OpenOPS/pages/146440579/Native+Open+edX+Ubuntu+16.04+64+bit+Installation

 

  • 硬件配置 1CPU/4G RAM/500G HD
  • Ubuntu用户 edustack,密码 edustack.org
  • 没有生成随机密码,各种系统服务都使用默认密码。仅用于开发测试。

下载地址

http://202.196.166.180/downloads/%E5%AE%9E%E9%AA%8C%E8%BD%AF%E4%BB%B6/%E9%95%9C%E5%83%8F/edustack-ginkgo2.ova

百度网盘

https://pan.baidu.com/s/1qZ8QIsO 密码:fxaz

https://pan.baidu.com/s/1sngEEoX 密码:1s29

运维文档

https://openedx.atlassian.net/wiki/spaces/OpenOPS/pages/60227913/Managing+OpenEdX+Tips+and+Tricks

https://openedx.atlassian.net/wiki/spaces/OpenOPS/pages/19662636/How-to+articles

https://openedx.atlassian.net/wiki/spaces/OpenOPS/pages/88375372/Common+Issues+and+How+to+Fix+Them

开发文档

https://openedx.atlassian.net/wiki/spaces/OpenDev/overview

 

Open edX Ginkgo 中文语言包

项目地址 https://github.com/eduStack/ginkgo.zh-CN

在Transifex语言包基础上进行了修正和补充。经过验证没有语法错误。

安装方法:

1 加载edxapp环境

sudo -H -u edxapp bash
source /edx/app/edxapp/edxapp_env
cd /edx/app/edxapp/edx-platform

2 下载语言包

git clone https://github.com/eduStack/ginkgo.zh-CN

将下载的po文件拷贝到conf/locale/zh_CN /LC_MESSAGES

3 检查翻译

cd /edx/app/edxapp/edx-platform
i18n_tool validate -l zh_CN

执行后在conf/locale/zh_CN /LC_MESSAGES输出.dup和.prob文件,文件中指出翻译错误的地方。

4 编译翻译文件

paver i18n_fastgenerate

paver i18n_fastgenerate和paver i18n_generate的区别在于,paver i18n_generate会首先paver i18n_extract然后编译,而paver i18n_fastgenerate会直接编译。

5 重启edX服务,重启Nginx,清除浏览器缓存。