[Ilugc] [Help] Data mining Coursera Course catalogue

  • From: gowkanimozhi@xxxxxxxxx (Gowtham Sundaar)
  • Date: Sun, 30 Aug 2015 17:21:50 +0530

Download a packaged distribution like anaconda. Way simpler.
On Aug 30, 2015 4:06 PM, "Baskar Selvaraj" <baskar at linuxpert.in> wrote:

Dear all,

I am trying to access the Coursera course catalog through the following
python program.

http://adilmoujahid.com/posts/2015/03/coursera-data-mining/

All required libraries including 'pandas' got installed.

while executing 'get_data.py', I am getting the following error.

Getting Courses Data
Structuring the Data
Traceback (most recent call last):
  File "get_data.py.orig", line 76, in <module>
    main()
  File "get_data.py.orig", line 42, in main
    courses_df['course_name'] = map(lambda course_data:
course_data['name'], courses_data)
  File "/usr/lib/python2.7/site-packages/pandas/core/frame.py", line 1804,
in __setitem__
    self._set_item(key, value)
  File "/usr/lib/python2.7/site-packages/pandas/core/frame.py", line 1843,
in _set_item
    value = self._sanitize_column(key, value)
  File "/usr/lib/python2.7/site-packages/pandas/core/frame.py", line 1872,
in _sanitize_column
    assert(len(value) == len(self.index))
AssertionError

I have no experience with Python.  What I actually require is the resulting
data in CSV/TSV format.

Any help would be appreciated.

--
S. Baskar
_______________________________________________
ILUGC Mailing List:
http://www.ae.iitm.ac.in/mailman/listinfo/ilugc
ILUGC Mailing List Guidelines:
http://ilugc.in/mailinglist-guidelines


Other related posts: